أضاف Grok، برنامج الدردشة الآلي المدعم بالذكاء الاصطناعي والمدمج في X.com، بهدوء القدرة على تحليل الصور. لقد قمت باختباره، ويبدو أنه يقوم بعمل جيد جدًا، حتى تصل إلى حد الاستخدام في الحساب المجاني، والذي تم تعيينه على عدد منخفض جدًا من ثلاث تحميلات في وقت كتابة هذا التقرير.
لاستخدام ميزات تحليل الصور الجديدة لـ Grok على الهاتف المحمول، ما عليك سوى تحميل تطبيق X، ثم النقر فوق علامة التبويب Grok في الجزء السفلي من الشاشة (مربع به خط عبره) ثم الزر + لتحميل صورة. في المتصفح، انتقل إلى X.com وانقر على Grok في القائمة اليسرى، ثم استخدم زر مشبك الورق لإرفاق صورة للتحميل. بمجرد تحميله، يمكنك بعد ذلك طرح بعض الأسئلة على Grok حول هذا الموضوع
تحليل الصور
في البداية، قمت بتحميل رسم كاريكاتوري لأوديسيوس، وهو ملك من الأساطير اليونانية ظهر في ملحمة هوميروس (كنت قد شاهدت للتو العودةلذا تحملوني) لمعرفة ما إذا كان بإمكان جروك التعرف عليه. قام Grok بعمل جيد جدًا في إدراك أنها شخصية تاريخية من نمط الرسوم المتحركة، ويمكنني حتى أن أجعلها تولد المزيد من الصور ذات الطبيعة المشابهة بمجرد كتابة مطالبات مثل “أعد الصورة ولكن اجعلها من الرسوم المتحركة” المرأة بدلاً من ذلك”.
إن القدرة على تحليل محتوى الصورة بحيث يمكن إعادة إنتاجها مع التغييرات هي قدرة مفيدة، ولكنها ليست شيئًا لا يستطيع منافسوه مثل ChatGPT القيام به أيضًا. ولكن ماذا عن فهم النص في الصور؟
تحليل النص في الصور
لقد قمت بتحميل صورة منشور لفصل لياقة بدنية محلي، وطلبت من Grok أن يخبرني بالنص الذي وجده في الصورة. لقد استخرج كل النص بشكل مثالي، وقدم أيضًا روابط قابلة للنقر إلى عناوين الويب التي عثر عليها. لا يبدو أنه يوفر رابطًا لاسم حساب Instagram؛ لكن ChatGPT لم يفعل ذلك أيضًا عندما اختبرته.
تعد القدرة على استخراج النص من الصورة أمرًا واحدًا، ولكن يحتاج Grok إلى أن يكون قادرًا على تحليل هذا النص أيضًا. لاختبار Grok، قمت بتحميل جدول زمني لصالة الألعاب الرياضية المحلية للفنون القتالية وسألته عما إذا كان هناك فصل BJJ في أيام الخميس يمكنني الذهاب إليه. أجاب بالإجابة المثالية: “نعم، هناك فصل BJJ يوم الخميس الساعة 7:00 صباحًا (BJJ Gi للبالغين والمراهقين) وفي الساعة 8:00 مساءً (BJJ No Gi للبالغين والمراهقين).” قد تكون ميزة كهذه مفيدة حقًا للأشخاص الذين لديهم مشكلة في معالجة المعلومات المرئية.
ولأخذ تحليل صور Grok إلى أبعد من ذلك، حاولت تحميل نص أكاديمي كملف PDF لمعرفة تأثير ذلك، ولكن اتضح أن تحميل PDF غير متاح على Grok إلا إذا قمت بالترقية إلى Premium. التقطت لقطة شاشة للصفحة الأولى من المستند دون إزعاج، وطلبت من Grok تلخيص النص. مرة أخرى، قامت بعمل مثالي، حيث قسمت إجابتها إلى عناوين فرعية مثل “نتائج البحث” و”المساهمة العلمية” و”السياق التاريخي”، في حين أن ChatGPT أنتج ببساطة بضع فقرات من الملخص. ويبدو أن Grok لديه الأفضلية على ChatGPT هنا.
Grok vs ChatGPT
أكبر مشكلة مع Grok حاليًا هي أنك وصلت بسرعة كبيرة إلى حد الاستخدام المجاني لتحميل الصور – ومرة أخرى لكي نكون منصفين، فقد وصلت أيضًا بسرعة إلى حد ما على المستوى المجاني من ChatGPT أيضًا. ثلاث عمليات تحميل ليست كثيرة في يوم واحد. بصرف النظر عن ذلك، فإن Grok جيد بشكل مثير للإعجاب في تحليل الصور، حتى أنه يتفوق على ChatGPT في بعض المناطق، ويستحق التحقق مما إذا كانت الميزة تبدو مفيدة لك.
- لقد استخدمت طبقة Grok المجانية الجديدة على X ولكن لا يمكنني عرض النتائج لك لأنها قد تنتهك حقوق الطبع والنشر الخاصة بـ Nintendo
- يتوفر تطبيق Grok للهاتف المحمول، وقد لا يكون حذرًا للغاية
- Grok vs. ChatGPT: هل يستطيع Elon Musk’s X مواجهة OpenAI العملاق للذكاء الاصطناعي؟
1 thought on “بإمكان Elon Musk’s Grok الآن تحليل الصور ويقوم بعمل جيد جدًا، حتى تصل إلى حد الاستخدام الخاص بك”