كيف يقارن التفكير “الموسع” الجديد لـ Claud

أصدرت الأنثروبور للتو نموذجًا جديدًا يسمى Claude 3.7 Sonnet ، وعلى الرغم من أنني مهتم دائمًا بأحدث إمكانيات الذكاء الاصطناعي ، إلا أن الوضع “الممتد” الجديد هو الذي لفت انتباهي حقًا. ذكرني كيف ظهر Openai لأول مرة في نموذج O1 الخاص به لـ ChatGPT. عرضت طريقة للوصول إلى O1 دون مغادرة نافذة باستخدام طراز ChatGPT 4O. يمكنك الكتابة “/العقل” ، وسيستخدم AI chatbot O1 بدلاً من ذلك. إنه لا لزوم له الآن ، على الرغم من أنه لا يزال يعمل على التطبيق. بغض النظر ، فإن التفكير الأعمق والأكثر تنظيماً الذي وعد به كلاهما جعلني أرغب في معرفة كيف سيفعلون ضد بعضهم البعض.

تم تصميم الوضع الموسع لـ Claude 3.7 ليكون أداة تفكير مختلطة ، مما يمنح المستخدمين خيار التبديل بين الاستجابات السريعة والمحادثة وحل المشكلات المتعمقة. يستغرق الأمر وقتًا لتحليل موجه قبل تقديم إجابته. هذا يجعلها رائعة للرياضيات والترميز والمنطق. يمكنك حتى ضبط التوازن بين السرعة والعمق ، مما يمنحه حد زمني للتفكير في رده. المواقع الإنسانية هذا كوسيلة لجعل الذكاء الاصطناعى أكثر فائدة للتطبيقات في العالم الحقيقي التي تتطلب حل المشكلات المنهجية ، على عكس الاستجابات على مستوى السطح فقط.

يتطلب الوصول إلى Claude 3.7 اشتراكًا في Claude Pro ، لذلك قررت استخدام العرض التوضيحي في الفيديو أدناه كاختبار بدلاً من ذلك. لتحدي وضع التفكير الممتد ، طلبت الأنثروبور من الذكاء الاصطناعى تحليل وشرح لغز الاحتمال الشهير المعروف باسم مشكلة Monty Hall. إنه سؤال صعب للغاية يتجه الكثير من الناس ، حتى أولئك الذين يعتبرون أنفسهم جيدين في الرياضيات.

الإعداد بسيط: أنت في عرض ألعاب وطلب منه اختيار أحد الأبواب الثلاثة. خلف واحد سيارة. وراء الآخرين ، الماعز. في نزوة ، قررت الأنثروبور الذهاب مع سرطان البحر بدلاً من الماعز ، ولكن المبدأ هو نفسه. بعد اتخاذ اختيارك ، يفتح المضيف ، الذي يعرف ما وراء كل باب ، أحدهما المتبقيين للكشف عن عنزة (أو سرطان البحر). الآن لديك خيار: التمسك باختيارك الأصلي أو التبديل إلى آخر باب غير مفتوح. يفترض معظم الناس أن هذا لا يهم ، ولكن على عكس ذلك ، يمنحك التبديل في الواقع فرصة 2/3 للفوز ، مع التمسك باختيارك الأول يتركك مع احتمال 1/3 فقط.

خيارات crabby

كلود 3.7 السوناتة مع التفكير الموسع – يوتيوب
كلود 3.7 السوناتة مع التفكير الموسع - يوتيوب


شاهد

مع تمكين التفكير الممتد ، اتخذ كلود 3.7 نهجًا أكاديميًا تقريبًا لشرح المشكلة. بدلاً من مجرد ذكر الإجابة الصحيحة ، وضعت بعناية المنطق الأساسي في خطوات متعددة ، مع التأكيد على سبب تحول الاحتمالات بعد أن تكشف المضيف عن سلطعون. لم يشرح فقط من خلال شروط الرياضيات الجافة ، أيضًا. ركض كلود من خلال السيناريوهات الافتراضية ، مما يدل على كيفية لعب الاحتمالات على التجارب المتكررة ، مما يجعل من الأسهل بكثير فهم سبب كون التبديل دائمًا خطوة أفضل. لم يتم نقل الرد. لقد شعرت أن وجود أستاذ يمشي من خلاله بطريقة بطيئة ومتعمدة ، مما يضمن أنني فهمت حقًا سبب خطأ الحدس المشترك.

قدم ChatGPT O1 الكثير من الانهيار ، وشرح القضية بشكل جيد. في الواقع ، أوضح ذلك بأشكال متعددة وأنماط. جنبا إلى جنب مع الاحتمال الأساسي ، فقد مر أيضًا نظرية اللعبة ، ووجهات النظر السردية ، والتجربة النفسية ، وحتى الانهيار الاقتصادي. إذا كان أي شيء ، كان الأمر ساحقًا قليلاً.

طريقة اللعب

هذا ليس تفكير كلود الممتد الذي يمكن أن يفعله ، رغم ذلك. كما ترون في الفيديو ، كان كلود قادرًا على إنشاء إصدار من مشكلة Monty Hall في لعبة يمكنك تشغيلها مباشرة في النافذة. محاولة نفس الموجه مع chatgpt O1 لم تفعل نفس الشيء. بدلاً من ذلك ، كتب Chatgpt نص HTML لمحاكاة المشكلة التي يمكنني حفظها وفتحها في متصفحي. لقد نجحت ، كما ترون أدناه ، لكنها اتخذت بضع خطوات إضافية.

chatgpt التفكير مونتي هول

(الصورة الائتمان: الإنسان)

على الرغم من وجود اختلافات صغيرة تقريبًا في الجودة اعتمادًا على نوع التعليمات البرمجية أو الرياضيات التي تعمل عليها ، فإن كل من التفكير الممتد لكلود ونموذج O1 من ChatGPT يوفرون أساليب تحليلية قوية للمشاكل المنطقية. أستطيع أن أرى ميزة ضبط الوقت وعمق التفكير الذي يقدمه كلود. ومع ذلك ، ما لم تكن في عجلة من أمرك أو تطلب من التحليلات الثقيلة بشكل غير عادي ، فإن ChatGPT لا يستغرق الكثير من الوقت وتنتج الكثير من المحتوى من التفكير.

القدرة على جعل المشكلة بمثابة محاكاة داخل الدردشة أكثر بروزًا. يجعل كلود يشعر أكثر مرونة وقوة ، حتى لو كانت المحاكاة الفعلية تستخدم رمزًا مشابهًا للغاية مع HTML المكتوبة بواسطة ChatGPT.

كاتب

أضف تعليق

arالعربية