تحتاج سورا إلى رفع مستوى لعبتها لتتناسب مع طراز الفيديو الجديد AI Runway

أستمتع دائمًا بفرصة للعبث مع مولدات الفيديو الذكاء الاصطناعي. حتى عندما تكون فظيعة ، يمكن أن تكون مسلية ، وعندما يسحبونها ، يمكن أن تكون مذهلة. لذلك ، كنت حريصًا على اللعب مع طراز Gen-4 الجديد في Runway.

تفاخرت الشركة بأن Gen-4 (ونموذجها الأصغر والأسرع من الأخوة ، Gen-4 Turbo) يمكن أن يتفوق على نموذج Gen-3 السابق في الجودة والاتساق. من المفترض أن GEN-4 يسمار فكرة أن الشخصيات يمكن أن تبدو كما هي بين المشاهد ، إلى جانب المزيد من حركة السوائل والفيزياء البيئية المحسنة.

من المفترض أيضًا أن تكون جيدة بشكل ملحوظ في اتباع الاتجاهات. أنت تعطيه مرجعًا مرئيًا وبعض النص الوصفي ، وينتج مقطع فيديو يشبه ما تخيلته. في الواقع ، بدا الأمر وكأنه يشبه إلى حد كبير طريقة ترويج Openai منشئ الفيديو الخاص به ، Sora.

على الرغم من أن مقاطع الفيديو التي تصنعها Sora رائعة عادةً ما تكون غير موثوقة في بعض الأحيان في الجودة. قد يكون مشهد واحد مثاليًا ، وقد يحتوي التالي على شخصيات تطفو مثل الأشباح أو الأبواب المؤدية إلى أي مكان.

فيلم سحري

وضع Runway Gen-4 نفسه على أنه سحر فيديو ، لذلك قررت اختباره مع وضع ذلك في الاعتبار ومعرفة ما إذا كان بإمكاني عمل مقاطع فيديو يروي قصة المعالج. ابتكرت بعض الأفكار لثلاثية خيالية صغيرة من بطولة معالج التجول.

أردت أن يلتقي المعالج بأميرة قزم ثم يطاردها من خلال البوابات السحرية. ثم ، عندما يواجهها مرة أخرى ، تتنكر كحيوان سحري ، ويحولها إلى أميرة.

لم يكن الهدف إنشاء مجموعة رائعة. أردت فقط أن أرى إلى أي مدى يمكن أن يمتد Gen-4 مع الحد الأدنى من المدخلات. لعدم وجود أي صور للمعالجات الحقيقية ، استفدت من مولد صور ChatGpt الذي تمت ترقيته حديثًا لإنشاء صور ثابتة مقنعة.

قد لا تفجر سورا هوليوود ، لكن لا يمكنني إنكار جودة بعض الصور التي تنتجها ChatGpt. لقد صنعت أول مقطع فيديو ، ثم استخدمت خيار Runway “لإصلاح” بذرة بحيث تبدو الشخصيات متسقة في مقاطع الفيديو. قمت بتجميع مقاطع الفيديو الثلاثة في فيلم واحد أدناه ، مع استراحة قصيرة بين كل منها.

سينما الذكاء الاصطناعي

يمكنك أن ترى أنها ليست مثالية. هناك بعض حركات الكائنات الفردية ، والمظهر المتسق ليست مثالية. تتلألأ بعض عناصر الخلفية بشكل غريب ، ولن أضع هذه المقاطع على شاشة المسرح حتى الآن. ومع ذلك ، فإن الحركات الفعلية للشخصيات وتعبيراتها وعواطفها شعرت بشكل مدهش.

علاوة على ذلك ، أحببت خيارات التكرار ، التي لم تطغى على الكثير من الخيارات اليدوية ولكن أعطتني أيضًا تحكمًا كافيًا حتى شعرت أنني كنت متورطًا بنشاط في الخلق وليس فقط الضغط على زر والصلاة من أجل التماسك.

الآن ، هل ستنزل شركاء Sora و Openai العديد من شركاء المخرجين المحترفين؟ لا ، بالتأكيد ليس الآن. لكنني ربما أجربها على الأقل إذا كنت مخرجًا أفلامًا للهواة أراد طريقة رخيصة نسبيًا لمعرفة شكل بعض أفكاري. على الأقل ، قبل إنفاق الكثير من المال على الأشخاص الذين يحتاجون إلى جعل الأفلام تبدو في الواقع تبدو قوية مثل رؤيتي لفيلم.

وإذا نمت مرتاحًا بما يكفي معها وجيدًا بما يكفي في استخدام AI ومعالجتها للحصول على ما أردت منه في كل مرة ، فقد لا أفكر في استخدام Sora. لا تحتاج إلى أن تكون معالجًا لترى أن هذا هو المدرج الإملائي يأمل في إلقاء قاعدة المستخدمين المحتملين.

كاتب

أضف تعليق

arالعربية