ما هو سورا OpenAI؟ شرح أداة تحويل النص إلى فيديو وكيف يمكنك استخدامها

كشف صانع ChatGPT OpenAI النقاب عن Sora، محرك الذكاء الاصطناعي الخاص به لتحويل المطالبات النصية إلى فيديو، في فبراير 2024، ولكن كان علينا الانتظار حتى ديسمبر 2024 حتى الإصدار الكامل، وحتى ذلك الحين كان متاحًا فقط في الولايات المتحدة. وكانت النتائج التي حصلنا عليها حتى الآن مذهلة.

يعمل سورا تمامًا كما تتوقع. ما عليك سوى كتابة نوع الفيديو الذي ترغب في مشاهدته وسيقوم Sora بالباقي. هناك بعض القيود على المدة التي يمكن أن تستغرقها مقاطع الفيديو وعدد المقاطع التي يمكنك إنشاؤها. يمنحك اشتراك ChatGPT Pro المزيد من الاعتمادات ويمكّنك من إنشاء مقاطع أطول بدون علامة مائية.

سنشرح هنا كل ما تحتاج لمعرفته حول OpenAI Sora: ما هو قادر عليه، وكيف يعمل، وكيفية الحصول عليه. لقد وصل عصر صناعة الأفلام النصية السريعة بالذكاء الاصطناعي أخيرًا.

تاريخ إصدار OpenAI Sora وسعره

في ديسمبر 2024، حصلت Sora على أول إصدار عام لها كجزء من حدث OpenAI “12 يومًا من OpenAI”. يتطلب Sora اشتراكًا في ChatGPT Plus أو Teams أو Pro لاستخدامه وهو متاح حاليًا في الولايات المتحدة فقط، ولكننا نتوقع إصدارًا عالميًا في وقت ما في عام 2025.

كلبان على البث الجبلي — مثال للفيديو، تم إنشاؤه باستخدام Sora. (حقوق الصورة: OpenAI)

مع أ شات جي بي تي بلس (20 دولارًا / 16 جنيهًا إسترلينيًا / 32 دولارًا أستراليًا في الشهر) أو فرق بالاشتراك (25 دولارًا/ 20 جنيهًا إسترلينيًا/ 40 دولارًا أستراليًا شهريًا لكل مستخدم) تحصل على جميع مزايا كونك مستخدم ChatGPT Plus، بالإضافة إلى ما يصل إلى 50 مقطع فيديو Sora ذي الأولوية (أي ما يعادل 1000 نقطة) شهريًا بدقة 480 بكسل. يمكن أن تكون دقة مقاطع الفيديو الخاصة بك 480 بكسل أو 720 بكسل ومدة 5 ثوانٍ. كما أنها تأتي مع علامة مائية.

مع أ اشتراك ChatGPT Pro (200 دولارًا / 165 جنيهًا إسترلينيًا / 325 دولارًا أستراليًا شهريًا) تحصل على وصول غير محدود إلى ChatGPT 4o وo1، بالإضافة إلى وصول محدود إلى أحدث وضع o1 pro. بالإضافة إلى ذلك، يمكنك الحصول على ما يصل إلى 500 مقطع فيديو ذي أولوية (أي ما يعادل 10000 نقطة). يمكنك أيضًا الحصول على “مقاطع فيديو مريحة” غير محدودة – والتي سيستغرق إنشاءها وقتًا أطول من مقاطع الفيديو ذات الأولوية. تصل دقة مقاطع الفيديو إلى 1080 بكسل، ويبلغ طولها 20 ثانية ويمكنك إنشاء خمسة مقاطع فيديو في وقت واحد. لديك أيضًا القدرة على تنزيل مقاطع الفيديو الخاصة بك بدون العلامة المائية.

مع هذه القيود، من الواضح جدًا أن اشتراك Pro الأكثر تكلفة مطلوب إذا كنت تريد استخدام Sora بأي صفة احترافية.

ما هو OpenAI سورا؟

التدريب العملي على OpenAI Sora — قائمة تعرض إعدادات سورا المسبقة. (رصيد الصورة: المستقبل)

ربما تكون على دراية بنماذج الذكاء الاصطناعي التوليدية – مثل Google Gemini للنص و Dall-E للصور – والتي يمكنها إنتاج محتوى جديد يعتمد على كميات هائلة من بيانات التدريب. إذا طلبت من ChatGPT أن يكتب لك قصيدة، على سبيل المثال، فإن ما ستحصل عليه سوف يعتمد على الكثير والكثير من القصائد التي استوعبها الذكاء الاصطناعي وحللها بالفعل.

OpenAI Sora فكرة مشابهة، لكن بالنسبة لمقاطع الفيديو. يمكنك إرسال رسالة نصية إليه، مثل “امرأة تسير في أحد شوارع المدينة ليلاً” أو “قيادة السيارة عبر الغابة” وستحصل على مقطع فيديو. كما هو الحال مع نماذج صور الذكاء الاصطناعي، يمكنك أن تكون محددًا للغاية عندما يتعلق الأمر بقول ما يجب تضمينه في المقطع ونمط اللقطات التي تريد رؤيتها.

للحصول على فكرة أفضل عن كيفية عمل ذلك، راجع بعض أمثلة مقاطع الفيديو التي نشرها الرئيس التنفيذي لشركة OpenAI سام التمان – لم يمض وقت طويل بعد أن تم كشف النقاب عن سورا للعالم، رد ألتمان للمطالبات المطروحة على وسائل التواصل الاجتماعي، وإرجاع مقاطع الفيديو بناءً على نص مثل “ساحر يرتدي قبعة مدببة ورداء أزرق به نجوم بيضاء يلقي تعويذة تطلق البرق من يده ويحمل كتابًا قديمًا في يده الأخرى”.

كيف يعمل OpenAI Sora؟

على مستوى مبسط، التكنولوجيا المستخدمة في Sora هي نفسها التي تتيح لك البحث عن صور كلب أو قطة على الويب. اعرض على الذكاء الاصطناعي ما يكفي من الصور لكلب أو قطة، وسيكون قادرًا على اكتشاف نفس الأنماط في الصور الجديدة؛ وبنفس الطريقة، إذا قمت بتدريب الذكاء الاصطناعي على مليون مقطع فيديو لغروب الشمس أو لشلال، فسيكون قادرًا على إنشاء مقطع فيديو خاص به.

بالطبع هناك الكثير من التعقيد تحت ذلك، وقد قدمته شركة OpenAI الغوص العميق في كيفية عمل نموذج الذكاء الاصطناعي الخاص به. لقد تم تدريبه على “بيانات على نطاق الإنترنت” لمعرفة شكل مقاطع الفيديو الواقعية، حيث يقوم أولاً بتحليل المقاطع لمعرفة ما ينظر إليه، ثم تعلم كيفية إنتاج نسخه الخاصة عندما يُطلب منه ذلك.

لذا، اطلب من Sora إنتاج مقطع لحوض الأسماك، وسيعود بتقدير تقريبي يعتمد على جميع مقاطع الفيديو التي شاهدها لحوض الأسماك. إنه يستخدم ما يُعرف بالتصحيحات المرئية، وهي كتل بناء أصغر تساعد الذكاء الاصطناعي على فهم ما يجب أن يذهب إلى أين وكيف يجب أن تتفاعل العناصر المختلفة للفيديو وتتقدم، إطارًا تلو الآخر.

فيديو OpenAI Sora يظهر الكائن الفضائي الأزرق في نيويورك — فيديو سورا يظهر كائن فضائي أزرق في نيويورك. (حقوق الصورة: OpenAI Sora)

يعتمد Sora على نموذج الانتشار، حيث يبدأ الذكاء الاصطناعي باستجابة “صاخبة” ثم يعمل على تحقيق مخرجات “نظيفة” من خلال سلسلة من حلقات ردود الفعل وحسابات التنبؤ. ومثل نماذج الذكاء الاصطناعي التوليدية الأخرى، يستخدم Sora تقنية المحولات (يشير الحرف T الأخير في ChatGPT إلى Transformer). تستخدم المحولات مجموعة متنوعة من تقنيات تحليل البيانات المتطورة لمعالجة أكوام من البيانات – حيث يمكنها فهم الأجزاء الأكثر أهمية والأقل أهمية مما يتم تحليله، ومعرفة السياق والعلاقات المحيطة بين مجموعات البيانات هذه.

ما لا نعرفه تمامًا هو المكان الذي عثرت فيه OpenAI على بيانات التدريب الخاصة بها – فهي لم تذكر مكتبات الفيديو التي تم استخدامها لتشغيل Sora، على الرغم من أننا نعلم أن لديها شراكات مع قواعد بيانات المحتوى. مثل شترستوك. في بعض الحالات، يمكنك ذلك انظر أوجه التشابه بين بيانات التدريب والمخرجات التي ينتجها سورا.

ماذا يمكنك أن تفعل مع OpenAI Sora؟

الماموث الصوفي يمشي عبر الصحراء OpenAI Sora Generation — ماموث صوفي يمشي عبر الصحراء، تم إنشاؤه باستخدام Sora من OpenAI. (رصيد الصورة: المستقبل)

عندما تفتح Sora، ترى صفحة مقصودة، وهي عبارة عن شبكة من محتوى الفيديو الذي تم إنشاؤه بواسطة الذكاء الاصطناعي لكل شخص آخر. إنه مكان رائع للبدء إذا كنت تبحث عن الإلهام لأنه يمكنك استخدام أي من مقاطع الفيديو هذه كنقطة بداية لإبداعاتك الخاصة عبر ما يطلق عليه OpenAI “الريمكس”.

عند إعادة المزج، يمكنك إجراء ريمكس خفيف، أو ريمكس دقيق، أو ريمكس قوي، أو حتى ريمكس مخصص. وبدلاً من ذلك، يمكنك اختيار إنشاء الفيديو الأصلي الخاص بك بناءً على مطالبة مثل، على سبيل المثال، “رجل يرقص على القمر يرتدي قبعة Stetson”.

لدى Sora أيضًا أداة Storyboard التي تساعدك على إنشاء وتوجيه نوع الفيديو الذي تريده. يمكنك استخدامه لتحديد المدخلات بدقة لكل إطار. هناك أيضًا إعدادات مسبقة تساعدك في إنشاء مقاطع فيديو، مثل Film Noir وStop Motion.

تعترف OpenAI ببعض القيود المفروضة على Sora في الوقت الحالي. لا تكون الفيزياء منطقية دائمًا، حيث يختفي الأشخاص أو يتحولون أو يندمجون في أشياء أخرى. لا يرسم Sora مشهدًا بممثلين فرديين وعناصر دعائم، بل يجري عددًا لا يصدق من الحسابات حول المكان الذي يجب أن تنتقل فيه وحدات البكسل من إطار إلى آخر.

في مقاطع فيديو Sora، قد يتحرك الأشخاص بطرق تتحدى قوانين الفيزياء، أو قد لا يتم تذكر التفاصيل – مثل قضمة من ملف تعريف الارتباط – من إطار إلى آخر. OpenAI على علم بهذه المشكلات وتعمل على حلها، ويمكنك الاطلاع على بعض الأمثلة على موقع OpenAI Sora لنرى ما نعنيه.

على الرغم من هذه الأخطاء، تأمل OpenAI في المستقبل أن يتطور Sora ليصبح محاكيًا واقعيًا للعوالم المادية والرقمية. في السنوات القادمة، يمكن استخدام تقنية Sora لإنشاء عوالم افتراضية خيالية لنستكشفها، أو تمكننا من استكشاف أماكن حقيقية بشكل كامل يتم تكرارها في الذكاء الاصطناعي.

كيف يمكنك الوصول إلى OpenAI Sora؟

جولة في متحف OpenAI Sora — جولة في المتحف تم إنشاؤها باستخدام سورا. (حقوق الصورة: OpenAI Sora)

في الوقت الحالي، لا يمكنك الدخول إلى Sora بدون اشتراك Plus أو Teams أو Pro. يمكنك الوصول إليه من sora.com. في الوقت الحالي، يتوفر Sora أيضًا في الولايات المتحدة فقط، لذا إذا حاولت الوصول إليه من بلد آخر، فسترى رسالة تفيد بأنه غير متوفر.

لدى OpenAI تاريخ في جلب جميع منتجاتها المدفوعة إلى الطبقة المجانية بطريقة ما، ونتوقع أن يتم إصدار نسخة من Sora في النهاية على الطبقة المجانية من ChatGPT، ولكن يبدو أننا بعيدون عن ذلك الذي يحدث الآن.

هل هناك أي شيء آخر مثل سورا؟

تم إنشاء Orc في Runway، Gen 2 — شركة مصفاة نفط عمان في الغابةتم إنشاؤها باستخدام Runway Gen 2. (حقوق الصورة: شركة Apple، Inc، Runway)

منذ الإعلان عن سورا تم إطلاق العديد من البدائل. يعد Runway واحدًا من أشهر مولدات “الفيديو من المطالبة”. لديها المدرج الجنرال 3 ألفا الإصدار المتاح، والذي يتعين عليك دفعه مقابل الوصول إليه (144 دولارًا سنويًا، أو حوالي 111 جنيهًا إسترلينيًا أو 214 دولارًا أستراليًا)، ولكنه نسخة رانواي جين 2 متاح للمحاولة مجانا. تحصل على 525 نقطة شهريًا، لكن تقتصر على مقاطع مدتها 4 ثوانٍ.

تمتلك Google مولدًا خاصًا بها لمقاطع الفيديو يسمى Veo، والذي من المتوقع أن يتم إطلاقه في وقت لاحق من هذا العام. من المؤكد أنه يبدو مثيرًا للإعجاب ولكنك تحتاج إلى الانضمام إلى قائمة الانتظار لتجربته.

المنافس الآخر على عرش جيل الفيديو بالذكاء الاصطناعي هو بيكا. إنه موجه للأفراد ويمكنك تحميل وتخصيص الشخصيات والكائنات والإعدادات باستخدام ميزة Scene Ingredients الجديدة.

وأخيرًا، تعد آلة Dream Machine الخاصة بشركة Luma AI منافسًا آخر على عرش تحويل النص إلى فيديو. مرة أخرى، ما عليك سوى كتابة بعض المطالبات النصية وسيقوم بإنشاء مقطع فيديو. يمكنك الاشتراك في أ حساب مجاني ولكن نظرًا لارتفاع الطلب، يقتصر المستوى المجاني على 20 جيلًا في اليوم. تقدم Luma أيضًا مستويات مدفوعة تصل إلى 399.99 دولارًا (حوالي 309 جنيهًا إسترلينيًا و595 دولارًا أستراليًا) شهريًا لمدة 2000 جيل والأولوية القصوى في قائمة الانتظار.

يتفوق برنامج Veo 2 الجديد من Google على OpenAI Sora من خلال إنشاء فيديو بدقة 4K AI – وإليك كيفية تجربته
تتحدى Pika OpenAI وSora بميزات إنشاء فيديو AI جديدة
أصبح إنشاء فيديو Sora AI موجودًا وهو جيد جدًا، مما جعلني أرغب في جمع 200 دولار أمريكي لطبقة ChatGPT Pro الخاصة بـ OpenAI

كاتب

Radar Tech website