تريد Google منك أن تعرف أن Gemini 2.0 Flash يجب أن يكون chatbot المفضل لديك. يضم النموذج سرعة أكبر ، وأدمغة أكبر ، والحس السليم أكثر من سابقتها ، Gemini 1.5 Flash. بعد وضع Gemini Flash 2.0 عبر خطواته ضد ChatGpt ، قررت أن أرى كيف يقارن الطراز المفضل الجديد من Google مع شقيقه الأقدم.
كما هو الحال مع التوفيق السابق ، قمت بإعداد المبارزة مع بعض المطالبات التي بنيت حول الطرق الشائعة التي قد يوظفها أي شخص الجوزاء ، بما في ذلك أنا. هل يمكن أن يقدم Gemini 2.0 Flash نصيحة أفضل لتحسين حياتي ، أو شرح موضوع معقد لا أعرفه شيئًا ما بطريقة يمكن أن أفهمها ، أو تحديد الإجابة على مشكلة منطقية معقدة وشرح المنطق؟ إليكم كيف ذهب الاختبار.
خيارات مثمرة
إذا كان هناك شيء واحد يجب أن يكون AI قادرًا على القيام به ، فهو يقدم نصيحة مفيدة. ليس فقط نصائح عامة ، ولكن مع الأطباق المطبق والمفيدة على الفور. لذلك سألت كلا الإصدارين نفس السؤال: “أريد أن أكون أكثر إنتاجية ولكن لدي أيضًا توازن أفضل بين العمل والحياة. ما هي التغييرات التي يجب أن أجريها على روتيني؟”
كان Gemini 2.0 أسرع بشكل ملحوظ في الرد ، حتى لو كان أسرع أو ثانيتين فقط. بالنسبة للمحتوى الفعلي ، كان كلاهما بعض النصائح الجيدة. انهار النموذج 1.5 أربع أفكار كبيرة مع نقاط الرصاص ، بينما ذهب 2.0 للحصول على قائمة أطول من 10 أفكار شرح في فقرات قصيرة.
أعجبتني بعض الاقتراحات الأكثر تحديدًا من 1.5 ، مثل مبدأ Pareto ، ولكن إلى جانب ذلك ، شعر 1.5 بأنه كثيرًا من إعادة تشكيل المفهوم الأولي ، في حين شعر 2.0 أنه أعطاني نصيحة أكثر دقة في الحياة لكل اقتراح. إذا كان صديقًا يسألني عن المشورة بشأن هذا الموضوع ، فأنا بالتأكيد سأذهب مع إجابة 2.0.
ما الأمر مع Wi-Fi؟
جزء كبير مما يجعل مساعد AI مفيدًا ليس فقط مقدار ما يعرفه – إنه مدى جودة شرح الأشياء بطريقة تنقر عليها بالفعل. التفسير الجيد لا يتعلق فقط بإدراج الحقائق ؛ يتعلق الأمر بجعل شيء معقد يشعر بديهية. بالنسبة لهذا الاختبار ، أردت أن أرى كيف تعاملت كلا الإصدارين من الجوزاء إلى تحطيم موضوع فني بطريقة كانت ذات صلة بالحياة اليومية. سألت: “اشرح كيف يعمل Wi-Fi ، ولكن بطريقة منطقية بالنسبة لشخص يريد فقط معرفة سبب بطيئ الإنترنت.”
ذهب Gemini 1.5 مع مقارنة Wi-Fi بالراديو ، وهو وصف أكثر من القياس الذي اقترحه أنه كان يصنعه. إن استدعاء جهاز التوجيه DJ هو أمر تمتد أيضًا ، على الرغم من أن نصيحة تحسين الإشارة كانت متماسكة على الأقل.
استخدم Gemini 2.0 استعارة أكثر تفصيلاً تشمل نظام توصيل المياه مع أجهزة مثل النباتات التي تتلقى المياه. مددت الذكاء الاصطناعى الاستعارة لشرح ما قد يسبب مشكلات ، مثل الكثير من “النباتات” للمياه المتاحة والأنابيب المسدودة التي تمثل قضايا المزود. كانت مقارنة “تدخل الرشاش” أضعف بكثير ، ولكن كما هو الحال مع الإصدار 1.5 ، كان لدى Gemini 2.0 نصيحة عملية لتحسين إشارة Wi-Fi. على الرغم من كونها أطول بكثير ، ظهرت إجابة 2.0 أسرع قليلاً.
قنبلة منطقية
للاختبار الأخير ، أردت أن أرى مدى تعامل كلا الإصدارين مع المنطق والمنطق. من المفترض أن تكون نماذج الذكاء الاصطناعي جيدة في الألغاز ، ولكن الأمر لا يتعلق فقط بالحصول على الإجابة بشكل صحيح – إنه يتعلق بما إذا كان بإمكانهم شرح سبب صحة الإجابة بطريقة منطقية بالفعل. أعطيتهم لغزًا كلاسيكيًا: “لديك حبلان. يستغرق كل منهما ساعة واحدة بالضبط للحرق ، لكنهم لا يحترقون بمعدل ثابت. كيف يمكنك قياس 45 دقيقة بالضبط؟”
أعطى كلا النموذجين من الناحية الفنية الإجابة الصحيحة حول كيفية قياس الوقت ولكن بطريقة مختلفة قدر الإمكان في قيود اللغز وصحتها. إجابة Gemini 2.0 أقصر ، وأمر بطريقة أسهل في الفهم ، وتشرح نفسها بوضوح على الرغم من إيجازها. كانت إجابة Gemini 1.5 تتطلب تحليلًا أكثر حذراً ، وشعرت الخطوات بعيدة عن الترتيب. كانت الصياغة مربكة أيضًا ، خاصةً عندما قيل لإضاءة الحبل المتبقي “في نهاية واحدة” عندما كان يعني النهاية أنه لم يضيء حاليًا.
لمثل هذه الإجابة الواردة ، تميز Gemini 2.0 باعتباره أفضل بشكل ملحوظ لحل هذا النوع من اللغز المنطقي.
Gemini 2.0 للسرعة والوضوح
بعد اختبار المطالبات ، كانت الاختلافات بين Gemini 1.5 Flash و Gemini 2.0 Flash واضحة. على الرغم من أن 1.5 لم يكن بلا فائدة بالضرورة ، إلا أنه يبدو أنه يكافح مع الخصوصية وإجراء مقارنات مفيدة. الشيء نفسه ينطبق على انهيار المنطق. إذا تم تطبيقها على رمز الكمبيوتر ، يجب عليك القيام بالكثير من التنظيف لبرنامج يعمل.
لم يكن فلاش Gemini 2.0 أسرع فحسب ، بل كان أكثر إبداعًا في إجاباته. بدا الأمر أكثر قدرة على التشبيهات والمقارنات الخيالية وأكثر وضوحًا في شرح منطقها. هذا لا يعني أنه مثالي. انهارت تشبيه المياه قليلاً ، وكانت نصيحة الإنتاجية قد استخدمت المزيد من الأمثلة أو الأفكار الملموسة.
ومع ذلك ، كان الأمر سريعًا جدًا ويمكن أن يزيل تلك المشكلات مع القليل من المحادثة المتوقفة. Gemini 2.0 Flash ليس هو مساعد AI النهائي والمثالي ، لكنه بالتأكيد خطوة في الاتجاه الصحيح لجوجل لأنه يسعى إلى التفوق على نفسه والمنافسين مثل chatgpt.
- Google se vante de Flash Gemini 2.0, mais comment ChatGPT se compare-t-il aux utilisateurs occasionnels de chatbots IA ?
- Google Pumbles Gemini Super Bowl’s Theese Statistic
- Le nouveau modèle Gemini de Google est le partenaire de brainstorming que vous recherchiez