الآن بعد أن خرج توليد الصور المحسّن من Openai للجمهور لاستخدامه لعدة ساعات ، دعنا نتجاوز كيف كان الأمر حتى الآن.
على جانبي ، لدي حساب ChatGpt مجاني واستخدمت بسرعة تخصيصي اليومية في غضون بضع دقائق فقط ، مما أدى إلى توليد بعض الصور للكلب. عندما طلبت رابعًا ، حصلت على الرد:
“يبدو أنني لا أستطيع إنشاء أي صور أخرى في الوقت الحالي. يرجى المحاولة مرة أخرى لاحقًا. اسمحوا لي أن أعرف ما إذا كان هناك أي شيء آخر يمكنني القيام به من أجلك!”
كما هو الحال مع معظم الميزات الجديدة ، فإن الطبقة المجانية من chatgpt سيكون لها بعض القيود.
كان لزميلي لانس أولانوف ، الذي كان في Chatgpt Plus ، محظوظًا أفضل ، على الرغم من أن الإطار الزمني لإنشاء الصور قد امتد بعيدًا ، وفي بعض الحالات ، يولد تنبيهًا إلى توقيت الطلب وإعادة المحاولة ، على الرغم من أن الصورة تم إنشاءها في النهاية.
يمكن أن ينتج ذلك عن اتصال الشبكة ، أو الأحمال الثقيلة ذات الاهتمام على خوادم Openai ، أو حتى الحد الأقصى … على الرغم من أن الأخير لا يبدو من المرجح أن يكون مستخدمًا مدفوعًا.
لقد وضعنا فقط توليد الصور في طراز 4O من خلال اختبار آخر ، هذه المرة نطلب شريط رسوم متحركة بأسلوب “الفول السوداني” تشارلز شولز. بينما اعترف ChatGPT بالطلب ، فقد رفضه بسبب حقوق الطبع والنشر.
بدلاً من ذلك ، فإن الشريط الهزلي المضحك الناتج بأسلوب مماثل ، مع شخصين مألوفين لهما أسماء جديدة وغيرها من الصفات لتمييزهما عن الأصل.
كان ذلك سريعًا!
من المؤكد أن Openai غطت قليلاً من الأرض في حوالي 15 ~ دقيقة فقط. قام سام التمان والفريق لأول مرة بتوليد الصور الأصلية في طراز 4O. بعد ذلك ، قدموا بعض العروض التوضيحية ، وقبل أن يتم لفه ، قمنا بالفعل باختبار الميزة في تطبيق ChatGPT لجهاز iPhone.
الآن ، كما أعلن Openai ، فإن النموذج المحسن يتم طرحه الآن للمستخدمين المحترفين ، ولكنه يأتي أيضًا إلى المستخدمين المجانيين. أكد Altman أيضًا أنه سيصل في النهاية إلى واجهة برمجة التطبيقات أيضًا.
بالعودة إلى العروض التوضيحية الحية ، يظهر Openai أنه يمكننا الآن الدردشة مع ChatGpt بشكل أكثر بصريًا. هذا يعني أنه يمكنك طلب طلبات للصور على التوالي ، وسوف تتذكر السياق.
في هذا المثال ، تم إرسال صورة لعملة معدنية ، ثم طلب الفريق من ChatGpt جعلها شفافة ، من بين طلبات أخرى.
بالنظر إلى أن توليد الصور المحسّن متاح بالفعل-أو على الأقل نشر-قام محرر TechRadar ، بانس أولانوف ، باختبار الميزة بالفعل.
أخذ لانس صورة شخصية وحملها إلى chatgpt عبر تطبيق iPhone. ثم طلب أن تتحول إلى نمط أنيمي. في المرة الأولى ، أعطته رأسًا كاملاً من الشعر ، ولكن بعد ذلك تم تصحيحه عندما طلب أن يكون أصلعًا.
لقد أزعج سام ألمان أيضًا أن نموذج توليد الصور الأصلي داخل 4O مصمم ليكون مسيئًا بعض الشيء في حدود ما إذا كان هذا هو ما توجهه إليه. العبارة الرئيسية هناك “في حدود العقل” ، ولا شك أن العديد من المستخدمين سيضعون ذلك في الاختبار.
الآن ، يطلب العرض التوضيحي الثاني صورة ملونة تصف نظرية النسبية ، مع بعض الفكاهة المضافة. أشار Altman أيضًا إلى أن نموذج توليد الصور أبطأ بعض الشيء ولكن النتيجة أعلى بكثير في الجودة.
في العرض التوضيحي الثاني ، أخذ فريق Openai صورة شخصية ثم طلب من ChatGpt الوصول إلى “نمط أنيمي”. استغرق الأمر عدة ثوانٍ ، لكنه بالفعل يولد ما تم طلبه. يمكنك رؤيته أعلاه.
كان سام ألمان سريعًا في ملاحظة أن توليد الصور المحسّن بدأ في طرحه الآن في ChatGPT و Sora للمستخدمين المحترفين ، وسيكون متاحًا للمستخدمين المجانيين أيضًا.
نرى أيضًا عملية نموذج توليد الصور الأصلي ضمن نموذج 4O ، حيث تحولت تلك الشخصية التي تم إنشاؤها إلى “Agi Meme”.
Openai لاول مرة توليد الصور الأصلية في طراز 4O
ونحن خارج السباقات – يسمي سام ألمان هذا أحد أكثر التقدم المرح ، وهو توليد الصور الأصلي في طراز 4O. لقد أشار بسرعة إلى “إنها خطوة كبيرة إلى الأمام” وشيء كان Openai متحمسًا للتشغيل لبعض الوقت ، لمجموعة كاملة من الناس.
يلاحظ Altman أفضل طريقة لشرح ذلك هي إظهار ذلك ، لذلك نحن بالفعل في عرض تجريبي. في غضون بضع ثوانٍ فقط بعد الموجه ، عرض Openai صورة مع ما قاله الفريق لديه “نص مثالي”. على ما يبدو إظهار قفزة من حيث فهم المطالبة وإنشاء الصورة بنص واضح ، وتأثير وجهة نظر فريدة.
بدأ البث المباشر من Openai ، وفي الفترة التي سبقت 2 مساءً ET / 11am PT / 6PM وقت بدء GMT ، نتعامل مع صور مختلفة. تتداخل بعض هذه ، لكنها تنعش كل بضع ثوان وتظهر جميع الأنماط المختلفة.
ملاحظات الوصف المباشر للبث المباشر سنسمع من سام ألتمان ، غابرييل جوه ، برايفوللا داريوال ، لو ليو ، آلان جابري ، ومنغتشاو تشونغ يناقشون توليد صور 4O.
حسنًا ، يلقي عنوان Livestream إضاءة أكثر بكثير حتى نراقبنا يمكننا توقعها … أكثر من الصورة المليئة بالغة. بعنوان “Generation 4o Image Generation in Chatgpt and Sora” ، وهذا يعني أننا على الأرجح نحصل على تحسينات لإنشاء صور داخل ChatGpt و Sora.
قد يعني ذكر هذا الأخير تحسينات عامة لتوليد النص إلى الفيديو أيضًا.
أقل من 15 دقيقة للذهاب الآن!

Gemini يتقدم قبل ChatGPT – الجمع بين الأبحاث العميقة مع نظرة عامة على الصوت هو واحد من أفضل الاستخدامات من الذكاء الاصطناعى التي رأيتها حتى الآن

أطلقت Openai للتو كتابًا مجانيًا من ChatGpt Bible سيساعدك على إتقان AI chatbot و sora

واحد من أغنى الرجال في العالم يرفع مليارات الدولارات التي تنفق على شراء أجهزة الكمبيوتر المحمولة لفصول الدراسية الأمريكية دون أي تحسينات واضحة
شاهد المزيد