شركة Open AI تصمم نموذج Sora الجديد لتوليد الفيديو يمكن إدخال وصف تفصيلي موجز أو دقيق باستخدام نموذج Sora ويتم إنشاء مشاهد فيديو عالية الدقة 1080 بكسل تشبه مقاطع الفيلم، حيث قد يظهر الفيديو أيضًا العديد من الأشخاص وميزات الخلفية وأنواع مختلفة من الحركة، يمكن أن يحاول Sora ملء التفاصيل وتوسيع مقاطع الفيديو الموجودة بالفعل. ادعى Open AI أن لديه فهمًا عميقًا للغة ونتيجة لذلك يمكنه فهم وتفسير الأوامر والأوصاف البشرية مما ينتج شخصيات نابضة بالحياة وعاطفية بالإضافة إلى ذلك فهو يُنشئ فيديو بأنماط متعددة ويفهم كيفية عمل الأشياء في العالم الحقيقي. صعوبات تواجه نموذج Sora يركز النموذج كثيرًا على الحفاظ على التماسك المعقول أو المنطقي، حيث أنه من المستحيل تحريك جسم ما في اتجاه غير واقعي بالنسبة للفيزياء، النموذج ليس خاليًا من العيوب وفقًا للشركة وقد يواجه مشكلات في تكرار فيزياء بعض السيناريوهات بأمانة وفهم بعض الظروف المعقدة. قد يواجه النموذج مشكلة في تمثيل الأحداث المرتبطة بمرور الوقت بشكل صحيح مثل اختيار زاوية أو اتجاه معين للكاميرا، أو قد يصبح مرتبكًا بسبب البيانات المكانية المقدمة من المتجه مثل اليمين واليسار. توفر نموذج Sora لن يتمكن النموذج من تعويض الإطارات المفقودة في المقاطع أو زيادة كميتها لتسريع عملية الفيديو فحسب بل سيمكن أيضًا من إنشاء مقاطع فيديو من الصور الثابتة، ومن خلال إنتاج إطارات إضافية في نهاية الفيديو الأولي سيعمل Sora أيضًا على تمكين إطالة الفيديو وتوسيعه. أصدرت OpenAI مقطع فيديو أنشأه Sora يظهر براعته في إنتاج مقاطع تبدو وكأنها تم التقاطها في الحياة الواقعية، كما يخضع نموذج Sora حاليًا للاختبار والتجريب، كما ان OpenAI لم تطلقه بعد، وكشفت الشركة أن فريقها المتخصص يقوم حاليًا باختبار المفهوم الأمني. ومضت الشركة المصنعة قائلة إنه من أجل الامتثال لمبادئ سلامة الذكاء الاصطناعي فإنها تبذل جهودًا متضافرة لتطبيق متطلبات السلامة الأكثر صرامة على هذا النموذج، بالإضافة إلى ذلك كشفت الشركة أنه من أجل التمييز بين مقاطع Sora وتجنب الخلط بينها وبين اللقطات الفعلية.
مشاركة :