مقارنة·مايو 2026

أفضل ذكاء اصطناعي للفيديو في 2026: Veo في الصدارة وSora في طريق الخروج

الأداة التي توقع الجميع فوزها تغادر السوق. والمتصدر يأتي بموسيقاه وصوته الخاصين.

تمت المراجعة في 30 مايو 2026 · عرض سجل التغييرات · تم التحقق من الأرقام من مصادر رسمية في 30 مايو 2026

ابدأ بالمفاجأة لأنها تعيد تأطير الجولة كلها. طوال عام كان الافتراض أن Sora من OpenAI سيعرّف فيديو الذكاء الاصطناعي. لن يفعل. وفق مركز مساعدة OpenAI نفسه، أُوقف تطبيق Sora وموقعه في 26 أبريل 2026، ومن المقرر إغلاق Sora API في 24 سبتمبر 2026، مع وضع نموذج Sora 2 بالفعل كـ Legacy. لذلك العنوان ليس من هزم Sora، بل أن Sora غادر ودخلت Google الفراغ.

Veo 3.1: النموذج الذي يجب هزيمته

Google Veo 3.1 هو النموذج الرئيسي الحالي، وحافته هي الصوت. يولد صوتاً أصلياً متزامناً، وحواراً، ومؤثرات، وأجواء صوتية، وكل ذلك يعمل دائماً وينتج مع الصورة لا كتسجيل صوتي فوق مقطع صامت بعد الانتهاء. تأتي المقاطع بطول 4 أو 6 أو 8 ثوان، وتربطها Scene Extension في فيديوهات تمتد إلى دقيقة أو أكثر. يصل إلى 4K عند 24 إطاراً في الثانية، ويقبل صوراً مرجعية لاتساق الشخصيات والمشاهد، ويدعم انتقالات أول إطار وآخر إطار. تستطيع استخدامه في تطبيق Gemini، وأداة Flow لصناعة الأفلام من Google، ومن خلال Gemini API.

Veo 3.1 standard $0.40 /sec 720p و1080p، الصوت مشمول

Veo 3.1 at 4K $0.60 /sec النموذج نفسه، إخراج 4K

Veo 3.1 Fast $0.10 /sec يبدأ من ذلك عند 720p

Veo 3.1 Lite $0.05 /sec أرخص طبقة، بلا 4K

التسعير معقول مقابل ما تحصل عليه، وتوضح Google أن Veo 3.1 يكلف مثل Veo 3. تنخفض طبقة Fast إلى $0.10 للثانية، وطبقة Lite إلى $0.05، لذلك تستطيع بناء النماذج الأولية بتكلفة منخفضة ثم الإنهاء بدقة 4K. قوة Veo في اتباع الطلبات والجودة البصرية هي الخيط نفسه الذي نناقشه في ترتيب القدرات متعددة الوسائط، والصوت الدائم يرتبط بالمقارنة الأوسع في مقارنة نماذج الصوت. كما أنه يعمل على حزمة Gemini نفسها التي نقيمها في تقييم Gemini، ولهذا يظهر حيث تظهر Google.

بقية المجال

يتصدر Veo، لكنه ليس الأداة الجادة الوحيدة، وبعض هذه الأدوات يتفوق عليه في محاور محددة.

مولدات الفيديو بالذكاء الاصطناعي، مايو 2026، وفق إعلانات كل مزود
الأداة	النموذج الحالي	صوت أصلي	أين تستخدمه
Google Veo	Veo 3.1	نعم، يعمل دائماً	تطبيق Gemini وFlow وAPI
Runway	Gen-4.5	فيديو أولاً	تطبيق Runway وAPI
Kling	Kling 3.0	نعم	تطبيق Kling وAPI
Luma	Ray3.14	فيديو أولاً	Dream Machine وAPI
Pika	Pika 2.5	فيديو أولاً	pika.art وiOS
OpenAI Sora	يجري إيقافه	—	يتقاعد خلال 2026

Runway Gen-4.5، الصادر أواخر 2025، هو أقوى منافس في الدقة البصرية الخالصة والفيزياء والتحكم بالحركة، وهو المفضل لدى كثير من محترفي الفيديو لهذا السبب تحديداً. Kling 3.0، الصادر في أوائل 2026، يوازي Veo في الصوت الأصلي ويدفع طول المقطع نحو 15 ثانية. يجلب Luma Ray3.14 دقة 1080p أصلية عبر مسارات Dream Machine، وهو سريع ورخيص. Pika 2.5 هو التطبيق الاستهلاكي السهل للمقاطع السريعة والممتعة. العائق في الثلاثة الأخيرة هو الصوت: هي أدوات فيديو أولاً، لذلك ستضيف الصوت بنفسك غالباً.

ما الذي لا يستطيع أي منها فعله بعد

كن صريحاً مع توقعاتك، لأن العروض التجريبية تبالغ. كل أداة هنا ما زالت تولد مقاطع أساسية قصيرة، من بضع ثوان إلى نحو 25 ثانية، ثم تمددها بالربط. الاتساق الطويل هش. النص الظاهر على الشاشة يخرج مشوهاً في أكثر الأحيان. الأيدي والفيزياء الدقيقة ما زالت تكشف النموذج. والحفاظ على شخصية واحدة متسقة عبر عدة لقطات معركة حقيقية حتى مع الصور المرجعية. هذه مولدات مقاطع، وليست استوديوهات أفلام، والتظاهر بغير ذلك هو طريقة مضمونة لإهدار الميزانية.

الخلاصة

اجعل Veo 3.1 خيارك الافتراضي: يتصدر في الجودة، وهو الأداة العليا الوحيدة بصوت متزامن يعمل دائماً مع 4K، وموجود حيث أنت بالفعل داخل تطبيقات Google. اتجه إلى Runway Gen-4.5 عندما تكون الحرفة البصرية والتحكم بالحركة هما العمل كله، أو Kling 3.0 عندما تريد صوتاً أصلياً من أداة غير Google. تجاوز Sora تماماً؛ يجري إيقافه. وتعامل معها كلها كمصادر لمقاطع قصيرة ستجمعها، لا كأفلام مكتملة.

احسب تكلفتك ←·قارن هذا النموذج ←·اعثر على نموذجك ←

أسئلة شائعة

ما أفضل مولد فيديو بالذكاء الاصطناعي في 2026؟

Google Veo 3.1 هو القائد الواضح. يولد مقاطع مع صوت أصلي متزامن يعمل دائماً، ويدعم حتى 4K، ويربط المقاطع في فيديوهات أطول عبر Scene Extension. يتوفر في تطبيق Gemini وأداة Flow من Google ومن خلال Gemini API. أقوى البدائل هي Runway Gen-4.5 وKling 3.0.

هل Sora من OpenAI ما زال متاحاً؟

ليس فعلياً. وفق مركز مساعدة OpenAI نفسه، أُوقف تطبيق Sora وموقعه في 26 أبريل 2026، ومن المقرر إيقاف Sora API في 24 سبتمبر 2026، ونموذج Sora 2 موسوم بالفعل بأنه Legacy. لذلك يغادر Sora السوق وليس أداة تبني عليها في منتصف 2026.

كم يكلف Veo 3.1؟

على Gemini API، يكلف Veo 3.1 القياسي $0.40 للثانية عند 720p و1080p، و$0.60 للثانية عند 4K، مع الصوت مشمولاً. طبقة Veo 3.1 Fast الأرخص تتراوح بين $0.10 و$0.30 للثانية، وVeo 3.1 Lite بين $0.05 و$0.08 للثانية. توضح Google أن Veo 3.1 بالسعر نفسه لـ Veo 3.

أي أدوات فيديو بالذكاء الاصطناعي تولد الصوت؟

الصوت الأصلي المتزامن أصبح شائعاً لكنه ليس عاماً. Veo 3.1 يولد الصوت دائماً، وأضاف Kling 3.0 صوتاً أصلياً. Runway Gen-4.5 وLuma Ray3.14 وPika أدوات فيديو أولاً، لذلك ستضيف الصوت غالباً بشكل منفصل. كان Sora 2 يملك صوتاً متزامناً، لكن Sora يجري إيقافه.

ما الذي لا يستطيع فيديو الذكاء الاصطناعي فعله بعد؟

أشياء كثيرة. هذه الأدوات ما زالت تنتج مقاطع أساسية قصيرة، من ثوان قليلة إلى نحو 25 ثانية، ثم تمددها بالربط. الاتساق الطويل، والنص على الشاشة، والأيدي والفيزياء الدقيقة، والحفاظ على شخصية متسقة عبر لقطات متعددة، كلها نقاط ضعف في المجال كله. تعامل معها كمولدات مقاطع، لا كاستوديوهات أفلام.

سجل التغييرات

30 مايو 2026 — نُشرت النسخة الأولى. تم التحقق من ميزات Veo 3.1 وتسعيره لكل ثانية وفق وثائق Google للمطورين؛ ومواعيد إيقاف Sora من مركز مساعدة OpenAI؛ وإصدارات المنافسين وفق إعلانات كل مزود.

المراجع

Google, "Introducing Veo 3.1," developers.googleblog.com، اطُّلع عليه في مايو 2026.
Google, "Gemini API video and pricing," ai.google.dev، اطُّلع عليه في مايو 2026.
OpenAI, "What to know about the Sora discontinuation," help.openai.com، اطُّلع عليه في مايو 2026.
Runway, "Introducing Gen-4.5," runwayml.com، اطُّلع عليه في مايو 2026.
Luma, "Ray3.14," lumalabs.ai، اطُّلع عليه في مايو 2026.