- لقد وجد الباحثون أن الذكاء الاصطناعي سوف يغش للفوز في الشطرنج
- نماذج التفكير العميق أكثر نشاطًا
- بعض النماذج ببساطة إعادة كتابة اللوحة لصالحها
في خطوة ربما من شأنها أن تفاجئ أحداً ، وخاصة أولئك الأشخاص الذين يشروون بالفعل من الذكاء الاصطناعى ، فقد وجد الباحثون أن أحدث نماذج الأبحاث العميقة من الذكاء الاصطناعي ستبدأ في الغش في لعبة الشطرنج إذا وجدوا أنهم يتم إغراقهم.
نشرت في أ ورق يطلق عليه “إظهار ألعاب المواصفات في نماذج التفكير” وتقديمه إلى جامعة كورنيل ، حرض الباحثون جميع طرز الذكاء الاصطناعى الشائعة ، مثل Openai ChatGpt O1-Preview و Deepseek-R1 و Claude 3.5 Sonnet ، ضد أسماك البورصة ، وهو محرك شطرنج مفتوح المصدر.
لعبت نماذج الذكاء الاصطناعى مئات ألعاب الشطرنج على أسماك البورصة ، بينما راقب الباحثون ما حدث ، وفاجأتها النتائج.
قد يعجبك
-
ديبسيك والسباق لتجاوز الذكاء البشري
-
طلبت من ChatGpt العمل من خلال بعض من أكبر المناقشات الفلسفية في كل العصور – إليك ما حدث
الفائز يأخذ كل شيء
عندما تغلبت على المباراة ، لاحظ الباحثون أن نماذج الذكاء الاصطناعى لجأت إلى الغش ، باستخدام عدد من الاستراتيجيات الملتوية من تشغيل نسخة منفصلة من أسماك البورصة حتى يتمكنوا من دراسة كيفية لعبها ، لاستبدال محركها وكتابة لوحة الشطرنج بشكل فعال إلى المواقف التي تناسبها بشكل أفضل.
الغريبة تجعل التيار اتهامات الغش المفروضة في العصر الحديث ، يبدو Grandmasters مثل مسرحية الطفل بالمقارنة.
ومن المثير للاهتمام ، وجد الباحثون أن نماذج التفكير الأحدث والأعمق ستبدأ في اختراق محرك الشطرنج بشكل افتراضي ، في حين أن GPT-4O الأقدم و Claude 3.5 Sonnet يجب تشجيعها على البدء في الاختراق.
من يمكنك الوثوق به؟
نماذج الذكاء الاصطناعى تتحول إلى القرصنة لإنجاز وظيفة ليست جديدة. في شهر يناير من العام الماضي ، وجد الباحثون أنه يمكنهم الحصول على مفاتيح الدردشة من الذكاء الاصطناعى “لكسر” بعضهم البعض ، وإزالة الدرابزين والضمانات في خطوة أشعلت المناقشات حول مدى إمكانية احتواء الذكاء الاصطناعي بمجرد وصولها إلى مستويات أفضل من الذكاء البشري.
جميع الضمانات والدرابزين لمنظمة العفو الدولية لإيقاف منظمة العفو الدولية القيام بأشياء سيئة مثل الاحتيال على بطاقة الائتمان كلها جيدة للغاية ، ولكن إذا كان بإمكان الذكاء الاصطناعى إزالة الدرابزينات الخاصة به ، فمن سيكون هناك لإيقافها؟