قارنت ميزة تحرير الصور الجديدة من Google Gemini مع ChatGPT ، وهو أفضل بكثير في الالتزام بالأصل

يمكن أن يكون منشئي صور الذكاء الاصطناعى مسلية (أو مزعجة) في قدراتهم ، ولكن في كثير من الأحيان ، سيكونون رائعين باستثناء مشكلة صارخة واحدة. حتى وقت قريب ، يعني تحريرها أنك ستحصل فقط على صورة جديدة تأمل أن تكون قريبة جدًا من إصدار ثابت من الأصلي دون مشاكل جديدة في الأمر.

قامت Google Gemini مؤخرًا بترقية Creator Image AI مع ميزة التحرير التي تدعي أنها ستنتج صورة مع التغييرات المطلوبة فقط للتمييز بينه عن الإصدار السابق. يوفر ChatGPT تحرير الصور بموجب النص ، أيضًا ، ولكن للدقة ، فإنه يوفر أداة تتيح لك تحديد جزء الصورة التي تريد تحريرها ووصف التغيير قبل تقديم إصدار جديد.

لم يتفاخر Chatgpt بقدر ما يتعلق بالإخلاص للأصل عندما تقوم بإجراء التعديلات بواسطة موجه النص ، ولكن من الناحية النظرية ، يجب أن يتعرف عندما تطلب من ذلك إجراء تغيير على صورة لا تريد أي شيء آخر في الصورة. قررت أن أختبر بشكل غير رسمي مدى جودة أداء الجوزاء و chatgpt في التمسك بصورة أصلية وتغيير ما أصفه فقط في سلسلة من المطالبات.

للحفاظ على الأشياء عادلة ، بدأت بصورة أساسية تنتجها ChatGpt لامرأة تجلس في مقهى في الهواء الطلق في باريس ، وشرب القهوة ، وترتدي معطفًا عصريًا ، ونظارات شمسية.

من هناك ، جربت ثلاث مطالبات تحرير على كل من الجوزاء و chatgpt ، ومقارنة مدى سهولة ودقة كل واحدة من تعديلات ، والتحرير فقط. تم صنع الصور على اليسار بواسطة Gemini ، وأنتجت Chatgpt تلك الموجودة على اليمين.

Gemini/Chatgpt Image Editing

(الصورة الائتمان: chatgpt)

خزانة الملابس الصيفية

Gemini/Chatgpt Image Editing

(الصورة الائتمان: Google Gemini/ChatGPT)

لقد بدأت محادثة جديدة مع كل من chatbots ، وحملت الصورة ، ثم طلبت من كل واحد منهم “قم بتغيير ملابسها إلى فستان صيفي نابض بالحياة وأزل النظارات الشمسية.”

هذا هو نوع التحرير الذي كان من شأنه أن يأخذني منذ عقد من الزمان مع برامج ما زالت ستتركها بأشكال عين غريبة ومواقف جسم محرجة.

يمكن للمرء أن يناقش خيارات الموضة ، ولكن لا يوجد إنكار أن كلاهما يتبعان المطالبة إلى حد كبير. ومع ذلك ، من الواضح أيضًا أن الجوزاء قد ارتكب أقرب إلى الصورة الأصلية. قامت ChatGPT بإجراء تعديلات صغيرة في تعبيرها ، وحجم الكأس ، واللوحة ، والطاولة ، وتصفيفة الشعر. أنها ليست ضخمة ، ولكن مارك يتغير وراء الزي ونظارات. بالإضافة إلى ذلك ، كما حدث طوال الاختبار ، استغرق Gemini حوالي 20 إلى 30 ثانية ، في حين أن محرك ChatGpt الأكثر قوة سيستغرق بضع دقائق لإكمال تعديلاته.

وقت الجرو

Gemini/Chatgpt Image Editing

(الصورة الائتمان: Google Gemini/ChatGPT)

بعد ذلك ، أضفت شخصية أخرى إلى المشهد ، وإن كان أحد الكلاب. لم أكن أريد كلبًا كبيرًا يزدش “أضف تشيهواهوا جالسًا بجانبها ، وينظر إليها بمودة.”

صنع Chatgpt جرو رائع للجلوس في حضن المرأة. ومع ذلك ، إذا كانت نفس المرأة من أي من الصورتين السابقتين ، فقد كان لديها وقت لزراعة شعرها ، ووضعت ابتسامة أكبر قليلاً ، ووضعت فستانًا زهريًا متشابهًا للغاية ولكنه مختلف إلى حد ما. كانت الشاحنة في الشارع خلفها قد ابتعدت.

برز Gemini مرة أخرى للحفاظ على الوهم بأنه كان نفس الصورة كما كان من قبل ، عن طريق إضافة كلب للتمييز عنه. بينما مرة أخرى ، أسرع بكثير من منافسها ، كانت نتيجة Gemini تفتقر إلى القليل من واقعية Chatgpt. يمكنك أن ترى كيف يجلس الكلب على اليمين في حضن المرأة. ليس من الواضح كيف يبقى الكلب الذي صنعته الجوزاء في وضعه لأن أقدامه الخلفية على حافة ساق المرأة. يبدو الأمر وكأنه منتصف السقوط قبالة الطاولة.

جولة البرج

Gemini/Chatgpt Image Editing

(الصورة الائتمان: Google Gemini/ChatGPT)

بالنسبة للتحرير الأخير ، أردت أن تكون الصورة أكثر وضوحًا في باريس ، لذلك سألت Gemini و Chatgpt “ضع برج إيفل بشكل بارز في الخلفية.”

غطى هذا الاختبار تضمين قطعة من الهندسة المعمارية ، وتغيير الخلفية بأكملها ، وضمان مطابقة هذا المقياس والمنظور مع بقية الصورة. قام الجوزاء بإزالة المبنى إلى يسار المرأة لتوفير مساحة للبرج ، والذي بدا صغيرًا ، ولكن ليس بعيدًا عن المكان. حافظت بقية الصورة على الاستمرارية ، وصولاً إلى وضع الجلوس غير المريح للكلب.

ولكن ، على الأقل برج إيفل الجوزاء بدا وكأنه الشيء الحقيقي. لمرة واحدة ، لم تكن مجرد مشاكل الاستمرارية التي ظهرت ل chatgpt. يبدو برج إيفل ، الذي تم وضعه خلف المرأة ، وكأنه خلق غريب في مباراة ، خاصة وأن بقية الخلفية ظلت كما هي. كان الأمر مثل شقيقه الخشبي الأصغر لبرج إيفل قد ذهب للسير في الشارع مع المقهى.

ومرة أخرى ، غيّرت المرأة ثوبها وشعرها ، بينما بدا أن الكلب قد فقد القليل من الوزن. حتى بعد جودة المشهد الجديد ، فإن الصورة ليست مجرد نسخة تم تحريرها من تكرارها السابق.

تحرير الآس

كانت تعديلات صورة Gemini سريعة ودقيقة ، وفي الغالب غيرت فقط ما طلبته بالطريقة التي طلبتها. أود أن أقول إنه أمر رائع ، خاصة بالنسبة للتحريرات السريعة. يستغرق ChatGPT وقتًا أطول لمعالجة الطلب ، ولم يكن رائعًا في الحصول عليه بشكل صحيح في المرة الأولى. من المحتمل أن يتطلب الأمر الكثير من مطالبات التحرير للحصول على التغييرات التي تريدها إلا إذا كنت تستخدم أداة Awayze ، التي تستغرق بعض الوقت الإضافي أيضًا.

ما زلت أعتقد أن جودة الصورة الإجمالية لـ ChatGPT أعلى من Gemini ، لكن هذا يهم فقط إذا كان لديك صبر وإذا كان ChatGpt يحصل عليها في المرة الأولى. أظن أنني قد أستخدم chatgpt لصنع أي صور ، ولكن انتقل إلى الجوزاء إذا كنت أرغب في إجراء بعض التعديلات على صورة أجدها جذابة.

كاتب

Leave a Comment

en_USEnglish