Jannah Theme License is not validated, Go to the theme options page to validate the license, You need a single license for each domain name.
تقنية وتكنولوجيا

يقوم Sora من OpenAI بإنشاء مقاطع فيديو واقعية – TechToday


أصدرت OpenAI في 15 فبراير نموذجًا جديدًا مثيرًا للإعجاب لتحويل النص إلى فيديو يسمى Sora والذي يمكنه إنشاء صور متحركة واقعية أو كرتونية من مطالبات نصية باللغة الطبيعية. سورا غير متاح للعامة بعد؛ وبدلاً من ذلك، قامت OpenAI بإصدار Sora لأعضاء الفريق الأحمر – الباحثين الأمنيين الذين يحاكيون التقنيات التي تستخدمها الجهات الفاعلة في مجال التهديد – لتقييم الأضرار أو المخاطر المحتملة. قدمت OpenAI أيضًا Sora لمصممين مختارين وفناني الصوت والصورة للحصول على تعليقات حول أفضل طريقة لتحسين Sora للعمل الإبداعي.

يعد تركيز OpenAI على السلامة حول Sora أمرًا قياسيًا للذكاء الاصطناعي التوليدي في الوقت الحاضر، ولكنه يُظهر أيضًا أهمية الاحتياطات عندما يتعلق الأمر بالذكاء الاصطناعي الذي يمكن استخدامه لإنشاء صور مزيفة مقنعة، والتي يمكن، على سبيل المثال، الإضرار بسمعة المنظمة.

ما هو سورا؟

سورا هو نموذج نشر الذكاء الاصطناعي التوليدي. يمكن لـ Sora إنشاء شخصيات متعددة وخلفيات معقدة وحركات ذات مظهر واقعي في مقاطع فيديو تصل مدتها إلى دقيقة واحدة. يمكنه إنشاء لقطات متعددة في فيديو واحد، مع الحفاظ على اتساق الشخصيات والأسلوب المرئي، مما يسمح لـ Sora بأن يكون أداة فعالة لسرد القصص.

في المستقبل، يمكن استخدام Sora لإنشاء مقاطع فيديو مصاحبة للمحتوى، أو للترويج للمحتوى أو المنتجات على وسائل التواصل الاجتماعي، أو لتوضيح النقاط في العروض التقديمية للشركات. على الرغم من أنه لا ينبغي أن يحل محل العقول المبدعة لصانعي الفيديو المحترفين، إلا أنه يمكن استخدام Sora لإنشاء بعض المحتوى بسرعة وسهولة أكبر. على الرغم من عدم وجود معلومات حول الأسعار حتى الآن، فمن الممكن أن يكون لدى OpenAI في النهاية خيار لدمج Sora في اشتراك ChatGPT Enterprise الخاص بها.

“ستكون وسائل الإعلام والترفيه هي الصناعة العمودية التي قد تكون من أوائل المتبنين لنماذج مثل هذه” ، قال محلل Gartner ونائب الرئيس المتميز Arun Chandrasekaran Chandrasekaran لـ TechRepublic في رسالة بالبريد الإلكتروني. “يمكن أيضًا أن تكون وظائف الأعمال مثل التسويق والتصميم داخل شركات ومؤسسات التكنولوجيا من أوائل المتبنين.”

كيف يمكنني الوصول إلى سورا؟

ما لم تكن قد حصلت بالفعل على حق الوصول من OpenAI كجزء من الفريق الأحمر أو الاختبار التجريبي للعمل الإبداعي، فلن يكون من الممكن الوصول إلى Sora الآن. قامت OpenAI بإصدار Sora لفنانين بصريين ومصممين وصانعي أفلام مختارين لمعرفة كيفية تحسين Sora للاستخدامات الإبداعية على وجه التحديد. بالإضافة إلى ذلك، أتاحت OpenAI إمكانية الوصول إلى باحثي الفريق الأحمر المتخصصين في المعلومات الخاطئة والمحتوى الذي يحض على الكراهية والتحيز. قال آرون تشاندراسيكاران، محلل Gartner ونائب الرئيس المتميز، إن الإصدار الأولي لـ Sora من OpenAI هو “نهج جيد ومتسق مع ممارسات OpenAI بشأن الإصدار الآمن للنماذج.”

وقال شاندراسيكاران: “بالطبع، هذا وحده لن يكون كافياً، وعليهم وضع ممارسات للتخلص من العناصر السيئة التي يمكنها الوصول إلى هذه النماذج أو الاستخدامات الشائنة لها”.

كيف يعمل سورا؟

سورا هو نموذج نشر، مما يعني أنه يقوم بتحسين الصورة غير المنطقية تدريجيًا إلى صورة مفهومة بناءً على الموجه، ويستخدم بنية المحولات. كان البحث الذي أجرته OpenAI لإنشاء نماذج DALL-E وGPT – وخاصة تقنية الاسترداد من DALL-E – بمثابة نقطة انطلاق لإنشاء Sora.

انظر: مهندسو الذكاء الاصطناعي مطلوبون في المملكة المتحدة (TechRepublic)

لا تبدو مقاطع فيديو Sora واقعية تمامًا دائمًا

لا يزال سورا يواجه صعوبة في التمييز بين اليسار واليمين أو متابعة الأوصاف المعقدة للأحداث التي تحدث مع مرور الوقت، مثل المطالبات المتعلقة بحركة معينة للكاميرا. وقالت OpenAI إنه من المرجح أن يتم رصد مقاطع الفيديو التي تم إنشاؤها باستخدام Sora من خلال أخطاء في السبب والنتيجة، مثل قيام شخص ما بأخذ قضمة من ملف تعريف الارتباط دون ترك علامة قضمة.

على سبيل المثال، قد تظهر التفاعلات بين الشخصيات عدم وضوح (خاصة حول الأطراف) أو عدم يقين من حيث الأرقام (على سبيل المثال، كم عدد الذئاب الموجودة في الفيديو أدناه في أي وقت معين؟).

ما هي احتياطات السلامة الخاصة بـ OpenAI حول سورا؟

باستخدام المطالبات والتعديلات الصحيحة، يمكن بسهولة الخلط بين مقاطع الفيديو التي ينشئها Sora ومقاطع فيديو الحركة الحية. تدرك OpenAI احتمالية مشاكل التشهير أو المعلومات الخاطئة الناشئة عن هذه التكنولوجيا. تخطط OpenAI لتطبيق مرشحات المحتوى نفسها على Sora كما تفعل الشركة مع DALL-E 3 والتي تمنع “العنف الشديد، أو المحتوى الجنسي، أو الصور التي تحض على الكراهية، أو شبه المشاهير، أو الملكية الفكرية للآخرين”، وفقًا لـ OpenAI.

إذا تم إصدار Sora للعامة، فإن OpenAI تخطط لوضع علامة مائية على المحتوى الذي تم إنشاؤه باستخدام Sora باستخدام بيانات تعريف C2PA؛ يمكن عرض البيانات التعريفية عن طريق تحديد الصورة واختيار خيارات قائمة معلومات الملف أو الخصائص. لا يزال بإمكان الأشخاص الذين يقومون بإنشاء صور تم إنشاؤها بواسطة الذكاء الاصطناعي إزالة البيانات الوصفية عن قصد، أو قد يفعلون ذلك عن طريق الخطأ. ليس لدى OpenAI حاليًا أي شيء لمنع مستخدمي منشئ الصور الخاص به، DALL-E 3، من إزالة البيانات الوصفية.

“هو بالفعل [difficult] وقال شاندراسيكاران: “سيصبح من المستحيل على نحو متزايد اكتشاف المحتوى الذي ينشئه البشر بواسطة الذكاء الاصطناعي”. “تقوم شركات رأس المال الاستثماري باستثمارات في الشركات الناشئة التي تقوم ببناء أدوات الكشف عن التزييف العميق، ويمكن أن تكون (أدوات الكشف عن التزييف العميق) جزءًا من درع المؤسسة. ومع ذلك، في المستقبل، هناك حاجة إلى شراكات بين القطاعين العام والخاص لتحديد المحتوى الذي يتم إنشاؤه بواسطة الآلة، غالبًا عند نقطة الإنشاء.

ما هي المنافسين لسورا؟

تعد مقاطع الفيديو الواقعية التي يقدمها Sora متميزة تمامًا، ولكن هناك خدمات مماثلة. يوفر Runway إنشاء تقنية الذكاء الاصطناعي لتحويل النص إلى فيديو جاهزة للمؤسسات. يمكن لـ Fliki إنشاء مقاطع فيديو محدودة مع مزامنة صوتية للسرد على وسائل التواصل الاجتماعي. يمكن للذكاء الاصطناعي التوليدي الآن إضافة المحتوى بشكل موثوق إلى مقاطع الفيديو الملتقطة أو تحريرها بالطريقة التقليدية أيضًا.

في 8 فبراير، كشف باحثو شركة Apple عن ورقة بحثية حول Keyframer، وهو نموذج اللغة الكبير المقترح الذي يمكنه إنشاء صور متحركة منمقة.

تواصلت TechRepublic مع OpenAI للحصول على مزيد من المعلومات حول Sora.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى