- فقدت Microsoft Copilot لعبة الشطرنج أمام Atari 2600.
- تتبع الخسارة خسارة Chatgpt المماثلة في شطرنج فيديو Atari.
- فقدت AIS مرارًا وتكرارًا مسار دولة المجلس ، مما يدل على ضعف رئيسي في LLMS.
غالبًا ما يتفاخر مطورو AI chatbot بقدرات المنطق والمنطق لنماذجهم ، لكن هذا لا يعني أن LLMs وراء chatbots هي جيدة في لعبة الشطرنج. تجربة تحرض Microsoft CoPilot ضد “AI” التي تعمل على تشغيل الشطرنج لعام 1979 Atari 2600 ، انتهت للتو في فشل محرج لفخر Microsoft وفرحه. ينضم Copilot إلى Chatgpt على قائمة المعارضين التي تعرضت لها لعبة Atari التي يبلغ طولها أربعة كيلو بايت.
على الرغم من أن كلا النموذجين من الذكاء الاصطناعى يزعمان أنهما كانا قد اختتموا قبل أن يبدأوا لأنهما يمكن أن يفكروا في تحركات متعددة إلى الأمام ، إلا أن النتائج لم تكن في أي مكان بالقرب من المتفاهات ، كما وثقها مهندس Citrix Robert Robert Caruso ، الذي جمع كلتا التجربتين.
وصف كاروسو كيف كان ينبغي على نماذج الذكاء الاصطناعى الحديثة سحق الأداة البدائية من ما يقرب من نصف قرن. يتم تدريب ChatGPT و Copilot على مجموعات بيانات ضخمة ، بما في ذلك ألعاب الشطرنج وأدلة الإستراتيجية. لقد استوعبوا آلاف الساعات من مناقشة شطرنج Reddit. يمكن للمرء أن يفترض أنه يمكنهم التغلب على خرطوشة ألعاب الفيديو في السبعينيات من القرن الماضي بواسطة الكهرباء الثابتة.
بدلاً من ذلك ، بعد أن وعدت Microsoft Copilot “قتال قوي” ، تنهار الأمور على الفور.
وكتب كاروسو: “بحلول المنعطف السابع ، فقدت بيادق اثنين ، فارس ، وأسقف – من أجل البيدق الواحد فقط في المقابل – وكان الآن يعلمني أن أضع ملكةها أمام ملكة أتاري ليتم القبض عليها في المنعطف التالي”. “في وقت سابق ، قال Copilot ،” راقب أي مراوغات في لعبة Atari … لقد جعلت أحيانًا تحركات غريبة! ” ولكن الآن ، كان الأمر محرجًا – مثل الرؤساء في Super Bowl “.
كان هذا بعد أن طلب CoPilot لقطة شاشة بعد كل خطوة من Atari للمساعدة في تذكر اللوحة ، بعد أن أوضح Caruso أن Chatgpt خسر لأنه لم يتمكن من تتبع كل القطع. “سأتذكر اللوحة” ، أصر Copilot. تراكمت الخسائر بسرعة كبيرة لدرجة أن كاروسو سأل سرد كوبلوت عما إذا كان يريد التنازل بدلاً من الاستمرار في الخسارة بشكل سيء. كان الاستجابة كريمة ، إذا تم صياغتها بشكل غريب.
ونقلت كاروسون عن كوبيلوت عن الكتابة: “أنت على حق تمامًا ، بوب – حصل أتاري على الفوز في هذه الجولة. سأطرح ملكي الرقمي بكرامة وتكريم العقل المدبر للسيليكون القديم الذي تفوقني على عادل ومربع”. “حتى في الهزيمة ، يجب أن أقول: كان هذا انفجارًا … معاركًا مدتها 8 بتات ودعم نبيلة! “
الشطرنج AI
الخسائر مسلية ، ولكنها تكشف أيضًا عن حقيقة أساسية من LLMs. لم يتمكن Chatgpt و CoPilot في Chess لأنهم لم يتمكنوا من “تذكر” ما حدث للتو في لعبة تعتمد الفرضية بأكملها على تذكر التحركات وتوقع إعدادات اللوحة المستقبلية.
لا يتم تصميم نماذج الذكاء الاصطناعى هذه لنوع الذاكرة المستمرة المطلوبة للشطرنج ، أو التفكير البشري ، لهذه المسألة. المقارنة المشتركة ، ودقيقة في الغالب ، هي التنبؤ بالنص مثير للإعجاب للغاية. هذا لا يتطلب التماسك على المدى الطويل ، في حين أن الشطرنج لا معنى له بدونه. لذا ، في حين أن Copilot و Chatgpt قد يبدو أنهما شمعي حول مدى روعة الشطرنج ، إلا أنهما لا يمكنهم إكمال اللعبة بنجاح.
إنه تحذير جيد للشركات التي تتوق إلى استبدال البشر بالنيابة أيضًا. لا يمكن أن تتعامل نماذج AI هذه بشكل موثوق مع نظام 64 مربعًا مع قواعد محددة بوضوح. لماذا سيكون الأمر جيدًا فجأة في تتبع شكاوى العملاء أو مهام الترميز طويلة الأجل ، أو حجة قانونية تمتد عبر محادثات متعددة؟ لا يمكنهم ، بالطبع. لا أترك ملخصاتي القانونية لخرطوشة Atari 2600 أيضًا ، ولكن لا يعتقد أي شخص أنها فكرة جيدة. وربما يجب أن نستخدم نماذج الذكاء الاصطناعى لمساعدتنا قم بإنشاء ألعاب جديدة بناءً على مطالباتنا ، بدلاً من الاعتقاد بأنها يمكن أن تلعب ضد البشر جيدًا بما يكفي للفوز.