الثورة القادمة في التحكم السينمائي وتغيير زوايا التصوير بالذكاء الاصطناعي

هل تمنيت يوماً لو كان بإمكانك تحريك الكاميرا داخل مشهد قمت بتصويره بالفعل؟ في 2026، أصبح هذا ممكناً بفضل InfCam. بينما تركز معظم الأدوات على توليد الصور، يأتي InfCam ليعيد تعريف مفهوم "المنظور" (Perspective)، مما يسمح للمبدعين بالتحكم الكامل في حركة الكاميرا داخل الفيديوهات الموجودة مسبقاً.

ما هي فكرة موديل InfCam؟
موديل InfCam هو أداة ذكاء اصطناعي متطورة مصممة لتعديل حركة الكاميرا (Camera Movement) أو تغيير المنظور (Perspective) في مشاهد الفيديو.
تغيير الزاوية: يمكنك تحويل لقطة ثابتة (static camera movement) إلى لقطة متحركة (Dolly Shot) أو تغيير زاوية الرؤية وكأنك أعدت وضع الكاميرا في مكان آخر.
الحفاظ على التفاصيل: المذهل في الموديل هو قدرته على توليد "البيانات المفقودة" عند تغيير الزاوية، بحيث تظل الخلفية والعناصر متناسقة مع المنظور الجديد دون تشويه.

بنية الموديل (Model Architecture)
يعتمد InfCam على معمارية معقدة تجمع بين توليد الفيديو وفهم الهندسة الفراغية للمشهد. كما تظهر الرسوم التوضيحية للموديل:
1ـ DiT Block: يستخدم الموديل "Diffusion Transformer" (DiT) مع طبقات "Homography-guided self-attention". هذه الطبقات تسمح للموديل بفهم العلاقة المكانية بين الكادرات (Frames) بناءً على حركة الكاميرا المطلوبة.
2ـ Cam Encoder: يتم إدخال معلومات الكاميرا (Camera Info) والبرومبت النصي ليقوم الـ Encoder بتحويلها إلى إشارات يفهمها الموديل لتوجيه عملية التوليد.
3ـ Warping Module: يحتوي الموديل على وحدة مخصصة للـ "Warping" تقوم بنقل البكسلات من المنظور القديم إلى الجديد بطريقة رياضية دقيقة قبل معالجتها بالذكاء الاصطناعي لملء الفراغات.

متطلبات التشغيل: هل جهازك مستعد لهذا الوحش؟
بما أن InfCam يعمل على معالجة فيديوهات كاملة بدقة عالية وبناء منظور ثلاثي الأبعاد، فإن متطلبات تشغيله الحالية تُعتبر "فلكية" للمستخدم العادي، ولكنه متاح كـ Open Source للمحترفين والمطورين.
المواصفات الحالية للتشغيل (Inference):
كارت الشاشة (GPU): يتطلب حالياً كارت NVIDIA H100 بذاكرة 80GB VRAM.
استهلاك الذاكرة (Memory Usage): يستهلك الموديل أكثر من 50GB من الذاكرة الرسومية، مقسمة كالتالي:
ـ48GB لموديل UniDepth (المسؤول عن فهم العمق).
ـ28GB لخط معالجة InfCam نفسه.
مستقبل InfCam والمصادر المفتوحة
رغم أن المتطلبات الحالية تحتاج إلى "سيرفرات" أو كروت شاشة احترافية جداً، إلا أن كون الموديل Open Source هو خبر رائع للجميع.
نحن نتوقع في الأشهر القادمة ظهور نسخ Quantized (مضغوطة) أو تقنيات Model Compression تسمح بتشغيل هذا الموديل على كروت شاشة منزلية مثل RTX 5090 أو حتى الـ 4090 مع بعض التضحيات البسيطة في الجودة. هذا سيفتح الباب لكل الـ Video Editors لاستخدام تقنيات كانت حكراً على استوديوهات هوليوود الكبرى.

Written By
Amr Mostafa
Published On
December 28, 2025