ذكاء اصطناعي متطور يحول صورة واحدة إلى مقطع فيديو

  • 6/16/2021
  • 00:00
  • 5
  • 0
  • 0
news-picture

واشنطن - طور باحثون في جامعة واشنطن طريقة تعلم عميق يمكنها تحويل صورة مفردة إلى مقطع فيديو. ويمكن لطريقة الفريق تحريك أي صورة فيها عنصر متدفق مثل شلالات المياه مثلا والدخان والغيوم.  وتنتج هذه التقنية مقطع فيديو قصيرا يتكرر بسلاسة، مما يعطي انطباعا بحركة لا نهاية لها، وسيقدم الباحثون ابتكارهم الجديد في 22 يونيو/حزيران الجاري خلال مؤتمر "الرؤية الحاسوبية والتعرف على الأنماط" الذي سيقام في واشنطن ويعد أحد المؤتمرات الرائدة في مجال الكمبيوتر. يقول المؤلف الرئيسي للدراسة ألكسندر هولينسكي، بحسب موقع "تيك إكسبلور" التقني: "ما يميز طريقتنا هو أنها لا تتطلب أي مدخلات من المستخدم أو معلومات إضافية، كل ما تحتاجه هو صورة لإنتاج فيديو عالي الدقة، يتكرر بسلاسة والذي يبدو غالبا وكأنه فيديو حقيقي." وكان تطوير طريقة تحول صورة واحدة إلى فيديو قابل للتصديق تحديا لهذا المجال، ووفقا لهولينسكي فإن الأمر يتطلب بشكل فعال توقع المستقبل، ففي العالم الحقيقي، هناك تقريبا احتمالات غير محدودة لما قد يحدث بعد ذلك". يتكون نظام الفريق من جزءين، أولهما يتنبأ بكيفية تحرك الأشياء عند التقاط الصورة، ثم يستخدم هذه المعلومات لإنشاء الرسوم المتحركة. ولتقدير الحركة، قام الفريق بتدريب شبكة عصبية تحتوي على آلاف مقاطع الفيديو للشلالات والأنهار والمحيطات وغيرها من المواد ذات الحركة السائلة. وتتكون عملية التدريب من مطالبة الشبكة بتخمين حركة الفيديو عند إعطاء الإطار الأول فقط وبعد مقارنة توقعها بالفيديو الفعلي تعلمت الشبكة تحديد القرائن - التموجات في التدفق على سبيل المثال - لمساعدتها على التنبؤ بما سيحدث بعد ذلك.  ثم يستخدم نظام الفريق هذه المعلومات لتحديد ما إذا كان يجب أن يتحرك كل بيكسل في الصورة وكيف يجب ذلك. وحاول الباحثون استخدام تقنية تسمى "سبلاتنغ" لتحريك الصورة، وتقوم هذه الطريقة بتحريك كل بيكسل وفقا لحركته المتوقعة.  ويوضح هولينسكي: "إذا قمت فقط بتحريك وحدات البيكسل إلى أسفل الشلال، بعد بضع إطارات من الفيديو، فلن يكون لديك وحدات بيكسل في الأعلى، لذلك ابتكر الفريق طريقة تتنبأ بكل من المستقبل والماضي للصورة ثم تدمجهما في رسم متحرك واحد". وأراد الباحثون أن تدور الرسوم المتحركة الخاصة بهم بسلاسة لخلق مظهر للحركة المستمرة، وتتبع شبكة الرسوم المتحركة بعض الحيل للحفاظ على حركة مثالية بما في ذلك نقل أجزاء مختلفة من الإطار في أوقات مختلفة وتحديد مدى سرعة أو بطء مزج كل بيكسل اعتمادا على محيطه. وتعمل طريقة الفريق بشكل أفضل مع العناصر ذات حركة السوائل المتوقعة، فعندما نرى شلالا، فإننا نعرف كيف يجب أن يتصرف الماء، وينطبق الشيء نفسه على النار أو الدخان.  وتخضع هذه الأنواع من الحركات لنفس مجموعة القوانين الفيزيائية، وعادة ما تكون هناك إشارات في الصورة تخبرنا كيف ستكون الحركة.

مشاركة :