مراجعة Gemini 3 Pro

متألق في سير عمل واحد بعينه، كفء في معظم الأشياء الأخرى، وغريب بطرق لا يشرحها ملف النموذج.

· عرض سجل التغييرات

الخطة الاستهلاكية $20 /شهر Gemini Advanced
مدخلات API $2 لكل مليون، $12 للمخرجات
سعة السياق 1M الأكبر في المستوى الحدّي
الرؤية الأفضل الأفضل في فئته وفق التقارير العامة

متألق. هذه هي الكلمة التي تصف Gemini 3 Pro في مهمة واحدة بعينها، وهي مبالغة واضحة في كل شيء آخر. تشير المواقف العامة لـ Google وسجل معايير الأداء العامة والنقاشات المجتمعية المستمرة كلها إلى الاتجاه ذاته.

يُفهم Gemini 3 Pro على أفضل وجه باعتباره مكملًا لـ Claude Opus 4.7، لا بديلًا عنه. الملاءمة الطبيعية هي أي شيء يمس صورة أو مستند Google Workspace، خاصةً عندما يعمل بقية الإعداد مع Anthropic أو OpenAI بالفعل. تشير مواد منتج Google الخاصة وهيكل التسعير كلاهما إلى دور أولوية الرؤية في إعداد متعدد النماذج.

النتيجة الرئيسية ضيقة ومتسقة. في المهام التي تجمع الرؤية والتفكير المنطقي — قراءة لقطة شاشة لوحة بيانات وشرح ما هو معطوب، تحليل ملف PDF مُعلَّق يدويًا، تحويل رسم سبورة بيضاء إلى وصف منظم — يتصدر Gemini 3 Pro المجال بفارق واضح. كل فئة أخرى أكثر تعادلًا، ونمط رفض يمتد عبر تبني الشخصيات والطلبات التخمينية لا يُصلحه أي قدر من هندسة الطلبات.

تتجلى بنية أولوية الرؤية التي تؤكدها Google في نظرة DeepMind الشاملة على Gemini في الممارسة العملية تمامًا حيث تتوقعها. في العمل النصي البحت، لا يحاول التفوق على Claude؛ بل يكسب مكانته في مرحلة مختلفة تمامًا من المسار.

أين تحل الرؤية المقترنة بالتفكير المنطقي

الفئة التي تسوّق لها Google بأقصى قدر هي الصورة المقترنة بالتفكير المنطقي، وسجل معايير الأداء العامة يدعم هذا التموضع. اختبار مرجعي شائع في المجتمع: لقطة شاشة للوحة إعدادات إدارية كثيفة، نحو أربعين عنصر تحكم في ثلاث علامات تبويب، بعضها رمادي أو في حالات غير محددة، بعضها غير متسق بصريًا مع جاراته. النقاش العام حول كيفية تعامل كل نموذج حدّي مع هذا النوع من الاختبارات متسق. يقرأ Gemini كل عنصر تحكم مرئي بدقة، ويسمي حالة كل مفتاح، ويشير إلى التناقضات البصرية التي تهم مراجعة التصميم. يُنتج Claude وصفًا كفؤًا لكنه يفوّت بعض تلك التناقضات. أحيانًا يُهلوس GPT-5 عناصر تحكم غير موجودة أصلًا، وهو الفشل الكلاسيكي لنماذج الرؤية.

يظهر الفارق ذاته في تحليل السبورة اليدوية، والتعرف الضوئي على الحروف بالصور، وصور مستندات الخط العربي. بنى Google النموذج حول الرؤية ويظهر ذلك. إذا كان عمل الصور مهمًا لإعدادك، فإن Gemini 3 Pro هو المرحلة الصحيحة لذلك الجزء من المسار، بصرف النظر عما يعمل في كل مكان آخر. للمقارنة الشاملة لجانب الصور عبر أربعة نماذج، راجع تصنيف القدرات متعددة الوسائط.

أين تحل الرؤية المقترنة بالتفكير المنطقي (نوعيًا)

قوة الملاءمة لمهام لقطات الشاشة والمستندات، توافق التقارير العامة.

Gemini 3 Pro
الأفضل
Claude Opus 4.7
جيد
GPT-5
مقبول
1M سعة السياق بالرموز. الأكبر في المستوى الحدّي عام 2026.

التكامل مع Workspace، أخيرًا

أمضى Google عامين يعد بتكامل Gemini مع Workspace ويُصدر إصدارات تراوحت بين عديمة الفائدة والضارة بالفعل. الإصدار المرفق مع Gemini 3 Pro هو الأول الذي يستحق تركه مفعّلًا. سحب البيانات المنظمة من جدول بيانات Sheets لتلخيصها كتابةً في مستند Docs يعمل، وكذلك صياغة رد مع سياق الخيط الكامل. طبقة البحث عبر مستندات Workspace أكثر فائدة مما كان عليه بحث Google منذ سنوات.

كل هذا مهم فقط إذا كان Workspace هو المكان الذي يعيش فيه عملك. الكتابة بـ Markdown والبرمجة في محرر احترافي يجعل التكامل أمرًا مريحًا نادرًا ما تلتجئ إليه. بالنسبة لمؤسسة تدير معظم عملها التشغيلي عبر Docs وSheets، فإنه يغير العمل اليومي بطرق حقيقية وقابلة للقياس. الحجة السعرية للخطة الاستهلاكية تظل قائمة في كلتا الحالتين: $20 شهريًا تعادل تقريبًا تكلفة غداءين، والتكامل يكسب تكلفته في يوم عمل واحد تستخلص فيه بيانات منظمة.

نمط الرفض

يرفض Gemini 3 Pro طلبات تجيب عليها النماذج الحدّية الأخرى دون تعليق. الرفضات ليست متوافقة مع فئات السلامة الواضحة. النقاش المجتمعي عبر منتدى مطوري Google وsubreddit Gemini والمجتمع البحثي الأوسع متسق: تتمحور الرفضات حول تبني الشخصيات، والتنبؤات التجارية التخمينية، والمهام التي يصنّفها النموذج بوصفها محتملةً أن تكون غير منصفة لفئة من الناس.

اطلب من النموذج أن يلعب دور محرر صارم يعطي ملاحظات على قطعة نصية فغالبًا يرفض، مستشهدًا بتحفظه من تبني شخصيات قد تبدو انتقادية. اطلب احتمالية نجاح واقعية على مدى ثلاث سنوات لفكرة شركة ناشئة وستحصل عادةً على رفض بشأن إصدار تنبؤات تجارية تخمينية. طلب مونولوج ساخر من ميكانيكي غاضب خيالي في نص فيديو يُرفض أيضًا، هذه المرة بسبب القلق من الصور النمطية السلبية لشخصيات من الطبقة العاملة.

لا شيء من هذه الرفضات خاطئ بشكل مجرد، وكل منها له مبرر معقول. المشكلة أن Claude وGPT-5 كلاهما يتعامل مع الطلبات ذاتها، لذا يتراكم احتكاك التحايل على رفضات Gemini عبر جلسة العمل إلى تكلفة في قابلية الاستخدام ستشعر بها. للأعمال التي تعتمد على تبني الشخصيات أو التفكير التخميني، خطط حول هذا النمط.

أي رفض منفرد سهل التجاوز. لكنها تُثقل كما تفعل حبة رمل صغيرة في حذاء، لا تشعر بها حتى تمشي ميلًا.

الرؤية

الأفضل قمة المجال

السياق الطويل

1M أكبر نافذة مغلقة المصدر

متعدد اللغات

جيد خاصةً مستندات الخط العربي

التفكير المنطقي

صلب ليس الأفضل في فئته

الكتابة

مقبول يتأخر عن GPT-5 في الأسلوب

البرمجة

الأضعف خلف Opus وGPT-5
1. الصورة مدخلًا

التقاط واجهة مستخدم، صورة، أو PDF ممسوح.

2. Gemini يقرأها

التعرف البصري الأصلي على الحروف وحالات عناصر التحكم.

3. التفكير المنطقي على النتيجة

ربط ميزات الصورة بسؤالك.

4. مخرجات منظمة

JSON، جدول، أو إجابة بلغة طبيعية.

  1. مارس 2023 إطلاق Bard

    أول منتج محادثة عام بالذكاء الاصطناعي من Google. لم يكن جيدًا.

  2. ديسمبر 2023 Gemini 1

    أول نموذج يحمل العلامة التجارية Gemini. مستويات Ultra وPro وNano.

  3. فبراير 2024 Gemini 1.5 Pro

    أول نافذة سياق بمليون رمز في الإنتاج.

  4. ديسمبر 2024 Gemini 2

    متعدد الوسائط أفضل، استنتاج أسرع، سعر أقل.

  5. نوفمبر 2025 Gemini 3 Pro

    سياق بمليون رمز، تفوق في الرؤية، تكامل مع Workspace يعمل أخيرًا.

ما يكلف

يكلف Gemini 3 Pro عبر AI Studio API دولارين لكل مليون رمز مدخل و12 دولارًا لكل مليون مخرج، وفق توثيق Gemini API من Google. يقع هذا السعر للمدخلات دون Opus 4.7 من Anthropic ($5) وفوق GPT-5 من OpenAI مباشرةً ($1.25) (متحقق من تسعير Google Cloud Vertex AI للاستخدام المؤسسي). للأعمال الكثيفة بالصور على نطاق واسع، الميزة السعرية ذات معنى: آلاف الصور يوميًا تتراكم بسرعة على أي نموذج.

أسعار API للمستوى الحدّي، مايو 2026، وفق وثائق المزوّدين
النموذجالمدخلات ($/مليون رمز)المخرجات ($/مليون رمز)الأفضل في
Gemini 3 Pro$2$12الرؤية، Workspace
Claude Opus 4.7$5$25البرمجة، السياق الطويل، التحفظ الصادق
GPT-5$1.25$10التصميم البصري، الدفء المحادثاتي

خطة Gemini Advanced الاستهلاكية بـ $20 شهريًا قرار واضح إذا كنت تعيش في Workspace. إذا كنت تفتح Workspace بضع مرات في الأسبوع فقط للمستندات المشتركة، تعامل مع التكامل كمزية إضافية وليس سبب الاشتراك. المستخدمون التقنيون سيستفيدون أكثر من مستوى API. لصورة التكلفة عبر جميع النماذج الحدّية والمتوسطة، راجع السعر لكل حالة استخدام.

الدور الذي ينبغي أن تضعه فيه

Gemini 3 Pro هو الأداة المناسبة لمهمة واحدة بعينها: أي شيء يجمع صورة مع سؤال. الفجوة مقارنة بالبدائل في فهم لقطات الشاشة، والرسوم اليدوية، والتعرف البصري على الحروف، وصور المستندات بالخط العربي كبيرة ومتسقة عبر السجل العام. لهذا العمل، هذا هو الاختيار الوحيد الصحيح في مطلع 2026.

للعمل العام (الكتابة، البرمجة، التفكير المنطقي الطويل) يُعدّ Gemini كفؤًا دون أن يتفوق على البدائل، وتفرض الرفضات ضريبة احتكاك فوق ذلك. التباين من جلسة إلى أخرى الذي يظهر في النقاشات المجتمعية هو نوع الخلل الذي ستصلحه Google على الأرجح في الإصدارات اللاحقة. إذا كان بإمكانك تشغيل نموذج واحد فقط، يظل Opus 4.7 الافتراضي الأفضل.

إذا كان بإمكانك تشغيل أكثر من نموذج، ضع Gemini 3 Pro في إعدادك كمرحلة الرؤية: وجّه لقطات الشاشة، وملفات PDF الممسوحة، ومستندات الخط العربي إليه، واترك كل شيء آخر لـ Claude أو GPT-5. هذا هو التصميم الذي يبدو أن سطح منتج Google يفترضه، ولعمل كثيف الصور هو أيضًا أرخص تقسيم يمكنك إعداده هذا الربع.

الأسئلة الشائعة

هل يستحق Gemini 3 Pro الاستخدام كنموذجك الرئيسي للذكاء الاصطناعي؟

فقط إذا كان عملك يعتمد كثيرًا على الرؤية. يضع Google نموذج Gemini 3 Pro لمهام لقطات الشاشة وصور المستندات وأعمال الرؤية المقترنة بالتفكير المنطقي. أما للبرمجة والكتابة النصية، فإن Claude Opus 4.7 وGPT-5 أفضل وفق سجل معايير الأداء العامة.

كم يكلف Gemini 3 Pro؟

دولاران لكل مليون رمز مدخل و12 دولارًا لكل مليون مخرج عبر AI Studio API. خطة Gemini Advanced الاستهلاكية بـ $20 في الشهر.

ما حجم سعة السياق في Gemini 3 Pro؟

مليون رمز كما هو معلن، في قمة المستوى الحدّي. استعلم عن السياق الطويل بدلًا من طلب تلخيصات آنية عبر النافذة بالكامل، حيث يصمد الاسترجاع أكثر موثوقية.

لماذا يرفض Gemini 3 Pro بعض الطلبات؟

يرفض النموذج تبني الشخصيات، والتنبؤات التجارية التخمينية، والمهام التي يصنّفها بوصفها محتملةً أن تكون غير منصفة لفئة من الناس. الرفضات معقولة على حدة وتتراكم كاحتكاك عبر جلسة العمل.

هل يجب أن أستخدم Gemini 3 Pro للبرمجة؟

لا. إنه كفء لكنه يتأخر عن كل من Claude Opus 4.7 وGPT-5 في قوائم ترتيب البرمجة العامة. استخدمه لمرحلة الرؤية في إعداد متعدد النماذج واحتفظ بنموذجك الافتراضي لكل شيء آخر.

سجل التغييرات

  • 25 مايو 2026 — أُعيدت كتابة الأقسام التي كانت تسرد نافذة اختبار خاصة مدتها 30 يومًا. تستند المقالة الآن إلى حكم موضوعها على تموضع Google، والتسعير المنشور، وسجل معايير الأداء العامة. أُضيفت ملاحظة دورة الحياة للانتقال إلى Gemini 3.1 Pro Preview.
  • 9 مارس 2026 — أُضيفت ملاحظة دورة الحياة: توقف Gemini 3 Pro لصالح Gemini 3.1 Pro Preview.
  • 1 مارس 2026 — نُشر أصلاً.

المراجع

  1. Google، "توثيق نماذج Gemini API،" ai.google.dev/gemini-api/docs/models، اطُّلع عليه في مايو 2026.
  2. Google، "سجل تغييرات Gemini API،" ai.google.dev/gemini-api/docs/changelog، اطُّلع عليه في مايو 2026.
  3. Google Cloud، "تسعير الذكاء الاصطناعي التوليدي في Vertex AI،" cloud.google.com/vertex-ai/generative-ai/pricing، اطُّلع عليه في مايو 2026.
  4. "قائمة ترتيب Chatbot Arena،" lmarena.ai، لقطة مايو 2026.
  5. Google DeepMind، "Gemini،" deepmind.google/technologies/gemini، اطُّلع عليه في مايو 2026.