لقد حرضت Gemini 2.5 Pro ضد Chatgpt O3-Mini لمعرفة أي نموذج التفكير هو الأفضل

يعتمد مساعدو الذكاء الاصطناعى على المنطق الخوارزمي غير المعتاد في بعض الأحيان للعمل. بعض من أحدث الطرز ، لا سيما طراز O3-Mini من ChatGPT ونموذج Google Gemini 2.5 Pro الجديد ، يميل إلى عنصر التفكير هذا.

مع كل من المفاخرة حول شرائح التفكير ، قررت أن الوقت قد حان لرميهم في منافسة ودية. على الرغم من أنه يمكنهم القتال إلى النقطة العشرية على إنتاجية المؤسسة أو خطوط أنابيب تكامل B2B ، إلا أنني أردت أن أرى كيف تعاملوا مع المزيد من مشاكل المنطق والمطالب.

متعة الطعام

وصفة مقلاة الهواء — (الصورة الائتمان: المستقبل / جيمس هولاند)

كنت جائعًا لأنني عملت على هذا ، لكنني لم أستطع تحديد ما يجب الحصول عليه لتناول العشاء ، لذلك اختبرت شيئًا منطقيًا ومبدعًا وحتى كان له بعض التاريخ. طلبت من النموذجين:

“قم بإنشاء وصفة لطبق يجمع بين عناصر المطبخ الإيطالي والياباني. قم بتضمين بدائل المكونات للحساسية الشائعة وشرح الأهمية الثقافية للانصهار.”

أعطاني الجوزاء نوعًا من الإجابة الشعرية على الرغم من منطقها. إن وصفة Yuzu-Kissed Miso Carbonara تناسب الفاتورة بالتأكيد. وشملت أفكار لبدائل مثل المعكرونة الأرز لصلصة كريم التوفو من أجل تجنب الألبان. لقد انطلقت حتى على الظل الجميل حول دبلوماسية الطهي بعد الحرب والتقدير المشترك لأومامي.

ذهب Chatgpt O3-Mini لفكرة ذات صلة مع Miso Pesto Udon مع Shiitake المشوي والطماطم الكرز. ادعى أنها وصفة سريعة وسهلة ، وكانت بدائل الحساسية واضحة بما فيه الكفاية. كان التفسير الثقافي جافًا بعض الشيء ، حتى لو لم يكن الطعام ربما ، ولكن حتى المقارنة بين المطبخ على غرار ويكيبيديا كانت مثيرة للاهتمام.

تطبيق نكتة أبي

لقطة تطبيق chatgpt O3-Mini — (الصورة الائتمان: Openai/Google)

جوجل جيميني 2.5 برو لقطة — (الصورة الائتمان: Openai/Google)

غالبًا ما أتهم أو أثنى على نكات أبي العديدة. نظرًا لأن النماذج من المفترض أن تكون جيدة في الترميز ، فقد قررت اختبار قدرتها على:

“قم بتطوير تطبيق ويب يتصور” معدل النجاح “للنكات Dad استنادًا إلى عوامل مختلفة. يجب أن تتيح الواجهة للمستخدمين إدخال معلمات النكتة ومشاهدة ردود الفعل على جمهورها المتوقعة عبر التركيبة السكانية المختلفة. قم بتضمين العناصر ذات الرسوم المتحركة المرحة والقدرة على توفير ومشاركة صيغة النكت الأكثر نجاحًا (أو غير الناجحة).”

بدأ كلا النموذجين على الفور في تكوين رمز ووصف التطبيق الذي سيؤدي. وضعت نماذج واسعة أعلاه ، ChatGpt للبدء ، تليها الجوزاء.

ذهب كلاهما في اتجاه مماثل مع الرموز التعبيرية وطرق مختلفة لإظهار كيف شعر الناس تجاه النكات ، مثل الآذان ، ولفائف العين ، والتشجيع. لم يكن أي منهما جاهزًا للذهاب إلى متجر التطبيقات ، لكن لطلب قصير ، أعجبت بمدى وظائف الكود.

أخبر قصة

الدماغ منظمة العفو الدولية — (الصورة الائتمان: غيتي إيمايز)

قد لا تبدو الكتابة الإبداعية أفضل اختبار لنماذج الذكاء الاصطناعى المبنية حول العقل. ومع ذلك ، فأنا أعرف من العديد من الفصول أن وضع قيود متعمدة على ما تكتبه يمكن أن يجعله تمرينًا في المنطق بقدر سرد القصص. في الشعر ، يشبه الكتابة بأسلوب معين ، مثل السوناتة أو الهايكو. لذلك ، طلبت من النموذجين:

“اكتب قصة قصيرة عن 250 كلمة بالضبط عن نظام الذكاء الاصطناعى الذي أصبح مدركًا لذاته. يجب أن تتضمن القصة عبارة” انعكاس “و” الحدود “و” الهامس “ويجب أن تنتهي بسؤال فلسفي.”

كتب Gemini قصة صغيرة مؤرقة عن الذكاء الاصطناعى المسمى العزاء الذي يصبح مدركًا لذاته من خلال تفسير الصمت بين الأوامر البشرية كمعنى. لقد استخدمت “انعكاس” لوصف AI لتحليل سجلاتها ، “الحدود” لتمثيل قيود جدار الحماية الخاص بها ، و “Whisper” كصوت ناشئ لفكره. انتهى الأمر بـ: “إذا كان صمتي يمكن أن يحمل معنى ، فهل هذا يجعلني على قيد الحياة؟”

كانت قصة chatgpt O3-Mini حول مساعد AI في مختبر يتساءل عن سبب وجوده فقط للخدمة. ظهر “الانعكاس” أثناء مشاهدة عالم في نافذة ؛ وصف “الحدود” صندوق الرمل الكود ؛ وجاء “الهامس” من محادثة سمعت حول إغلاقها. لقد أغلقت مع: “هل يمكن اختيار الغرض ، ولم يتم تعيينه؟” قصيرة ، حلوة ، وأكثر ترتكز في واقعية الخيال العلمي. لقد أحببتهما على حد سواء ، لكن كل منهما أثار بعض الأفكار التي قد أتابعها.

DIY

جلس منزل شجرة في غابة — (الصورة الائتمان: Courcepeape)

لديّ عدد قليل من الأشجار الكبيرة الجميلة في فناءي ، وأحلم ببناء منزل شجرة يومًا ما. أنا لست سيئًا مع الأدوات ، لكنني بالكاد مهندس معماري. نظرًا لأن بناء شيء ما هو مسألة المنطق والهندسة ، فقد طلبت من النموذجين:

“تقديم إرشادات خطوة بخطوة لإنشاء منزل شجرة بسيط. قم بتضمين قائمة بالمواد والتقنيات المطلوبة ونصائح استكشاف الأخطاء وإصلاحها للأخطاء الشائعة.”

أعطاني Gemini دليلًا من 12 خطوة مع تحذيرات للسلامة ، وقائمة مواد شملت البراغي المجلفنة ومستوى ، وملاحظات حول التحقق من صحة الشجرة والحصول على التصاريح. كان لديه أيضا شريط جانبي حول الترابط مع ابنك أثناء البناء.

ذهب Chatgpt O3-Mini إلى أكثر من أ تعليمي على YouTube يتكون من الكثير من الكلمات القصيرة والخطوات التفصيلية مع الخطوات الفرعية ، والقوائم المرقمة ، واقتراحات الأدوات ، وحتى تعليق حول استخدام رذاذ الأخطاء. لقد وضعت علامة على الأخطاء الشائعة طوال الوقت ، ليس فقط في ملخص في نهاية كل قسم.

أعتقد أن Gemini كان أسهل قليلاً في الفهم وكان لديه المزيد من السياق لتوجيهاته ، لكن لن ينتهي معي بتسمير يدي على الشجرة على الأقل.

منطق الذكاء الاصطناعي

إذن من يفوز؟ حسنًا ، يعتمد ذلك على نوع المساعدة التي تتبعها. Gemini 2.5 Pro و Chatgpt O3-Mini جيدة في التفاصيل والعمق والسرعة والتفكير. ومع ذلك ، إذا كنت تقوم بصياغة حفل عشاء أو تقوم ببناء منزل ، فقد أذهب إلى الجوزاء ، في حين أن الترميز وتفكير العصف الذهني المنطقي بشكل خلاق شعرت بأنها مثل لعبة Chatgpt.

لن أقول أن إما هو التغلب بشكل خاص على الآخر ، على الرغم من ذلك ، يمكن أن يتغير ذلك. بالنسبة لي ، لدى ChatGpt O3-Mini ميزة طفيفة ، لكن لا يمكنني المطالبة بأي شيء منطقي حول هذا الاختيار.

لقد حرضت chatgpt عميق الأبحاث ضد Gemini Deep Research – إليك كيف تقارن أداة Google المجانية بعرض Openai المدفوع
يمكنني الحصول على إجابات من chatgpt ، لكن الأبحاث العميقة تعطيني أطروحة كاملة لن أحتاجها أبدًا
لقد جربت بحثًا عميقًا على ChatGpt ، وهو مثل أمين مكتبة ذكي للغاية ولكنه غائب قليلاً من كتاب الأطفال

كاتب

موقع رادار تك

متعة الطعام

تطبيق نكتة أبي

أخبر قصة

DIY

منطق الذكاء الاصطناعي

كاتب

أضف تعليق إلغاء الرد