متألق. هذه هي الكلمة التي تصف Gemini 3 Pro في مهمة واحدة بعينها، وهي مبالغة واضحة في كل شيء آخر. تشير المواقف العامة لـ Google وسجل معايير الأداء العامة والنقاشات المجتمعية المستمرة كلها إلى الاتجاه ذاته.
يُفهم Gemini 3 Pro على أفضل وجه باعتباره مكملًا لـ Claude Opus 4.7، لا بديلًا عنه. الملاءمة الطبيعية هي أي شيء يمس صورة أو مستند Google Workspace، خاصةً عندما يعمل بقية الإعداد مع Anthropic أو OpenAI بالفعل. تشير مواد منتج Google الخاصة وهيكل التسعير كلاهما إلى دور أولوية الرؤية في إعداد متعدد النماذج.
النتيجة الرئيسية ضيقة ومتسقة. في المهام التي تجمع الرؤية والتفكير المنطقي — قراءة لقطة شاشة لوحة بيانات وشرح ما هو معطوب، تحليل ملف PDF مُعلَّق يدويًا، تحويل رسم سبورة بيضاء إلى وصف منظم — يتصدر Gemini 3 Pro المجال بفارق واضح. كل فئة أخرى أكثر تعادلًا، ونمط رفض يمتد عبر تبني الشخصيات والطلبات التخمينية لا يُصلحه أي قدر من هندسة الطلبات.
تتجلى بنية أولوية الرؤية التي تؤكدها Google في نظرة DeepMind الشاملة على Gemini في الممارسة العملية تمامًا حيث تتوقعها. في العمل النصي البحت، لا يحاول التفوق على Claude؛ بل يكسب مكانته في مرحلة مختلفة تمامًا من المسار.
أين تحل الرؤية المقترنة بالتفكير المنطقي
الفئة التي تسوّق لها Google بأقصى قدر هي الصورة المقترنة بالتفكير المنطقي، وسجل معايير الأداء العامة يدعم هذا التموضع. اختبار مرجعي شائع في المجتمع: لقطة شاشة للوحة إعدادات إدارية كثيفة، نحو أربعين عنصر تحكم في ثلاث علامات تبويب، بعضها رمادي أو في حالات غير محددة، بعضها غير متسق بصريًا مع جاراته. النقاش العام حول كيفية تعامل كل نموذج حدّي مع هذا النوع من الاختبارات متسق. يقرأ Gemini كل عنصر تحكم مرئي بدقة، ويسمي حالة كل مفتاح، ويشير إلى التناقضات البصرية التي تهم مراجعة التصميم. يُنتج Claude وصفًا كفؤًا لكنه يفوّت بعض تلك التناقضات. أحيانًا يُهلوس GPT-5 عناصر تحكم غير موجودة أصلًا، وهو الفشل الكلاسيكي لنماذج الرؤية.
يظهر الفارق ذاته في تحليل السبورة اليدوية، والتعرف الضوئي على الحروف بالصور، وصور مستندات الخط العربي. بنى Google النموذج حول الرؤية ويظهر ذلك. إذا كان عمل الصور مهمًا لإعدادك، فإن Gemini 3 Pro هو المرحلة الصحيحة لذلك الجزء من المسار، بصرف النظر عما يعمل في كل مكان آخر. للمقارنة الشاملة لجانب الصور عبر أربعة نماذج، راجع تصنيف القدرات متعددة الوسائط.
التكامل مع Workspace، أخيرًا
أمضى Google عامين يعد بتكامل Gemini مع Workspace ويُصدر إصدارات تراوحت بين عديمة الفائدة والضارة بالفعل. الإصدار المرفق مع Gemini 3 Pro هو الأول الذي يستحق تركه مفعّلًا. سحب البيانات المنظمة من جدول بيانات Sheets لتلخيصها كتابةً في مستند Docs يعمل، وكذلك صياغة رد مع سياق الخيط الكامل. طبقة البحث عبر مستندات Workspace أكثر فائدة مما كان عليه بحث Google منذ سنوات.
كل هذا مهم فقط إذا كان Workspace هو المكان الذي يعيش فيه عملك. الكتابة بـ Markdown والبرمجة في محرر احترافي يجعل التكامل أمرًا مريحًا نادرًا ما تلتجئ إليه. بالنسبة لمؤسسة تدير معظم عملها التشغيلي عبر Docs وSheets، فإنه يغير العمل اليومي بطرق حقيقية وقابلة للقياس. الحجة السعرية للخطة الاستهلاكية تظل قائمة في كلتا الحالتين: $20 شهريًا تعادل تقريبًا تكلفة غداءين، والتكامل يكسب تكلفته في يوم عمل واحد تستخلص فيه بيانات منظمة.
نمط الرفض
يرفض Gemini 3 Pro طلبات تجيب عليها النماذج الحدّية الأخرى دون تعليق. الرفضات ليست متوافقة مع فئات السلامة الواضحة. النقاش المجتمعي عبر منتدى مطوري Google وsubreddit Gemini والمجتمع البحثي الأوسع متسق: تتمحور الرفضات حول تبني الشخصيات، والتنبؤات التجارية التخمينية، والمهام التي يصنّفها النموذج بوصفها محتملةً أن تكون غير منصفة لفئة من الناس.
اطلب من النموذج أن يلعب دور محرر صارم يعطي ملاحظات على قطعة نصية فغالبًا يرفض، مستشهدًا بتحفظه من تبني شخصيات قد تبدو انتقادية. اطلب احتمالية نجاح واقعية على مدى ثلاث سنوات لفكرة شركة ناشئة وستحصل عادةً على رفض بشأن إصدار تنبؤات تجارية تخمينية. طلب مونولوج ساخر من ميكانيكي غاضب خيالي في نص فيديو يُرفض أيضًا، هذه المرة بسبب القلق من الصور النمطية السلبية لشخصيات من الطبقة العاملة.
لا شيء من هذه الرفضات خاطئ بشكل مجرد، وكل منها له مبرر معقول. المشكلة أن Claude وGPT-5 كلاهما يتعامل مع الطلبات ذاتها، لذا يتراكم احتكاك التحايل على رفضات Gemini عبر جلسة العمل إلى تكلفة في قابلية الاستخدام ستشعر بها. للأعمال التي تعتمد على تبني الشخصيات أو التفكير التخميني، خطط حول هذا النمط.
أي رفض منفرد سهل التجاوز. لكنها تُثقل كما تفعل حبة رمل صغيرة في حذاء، لا تشعر بها حتى تمشي ميلًا.
الرؤية
الأفضل قمة المجالالسياق الطويل
1M أكبر نافذة مغلقة المصدرمتعدد اللغات
جيد خاصةً مستندات الخط العربيالتفكير المنطقي
صلب ليس الأفضل في فئتهالكتابة
مقبول يتأخر عن GPT-5 في الأسلوبالبرمجة
الأضعف خلف Opus وGPT-5التقاط واجهة مستخدم، صورة، أو PDF ممسوح.
التعرف البصري الأصلي على الحروف وحالات عناصر التحكم.
ربط ميزات الصورة بسؤالك.
JSON، جدول، أو إجابة بلغة طبيعية.
-
مارس 2023
إطلاق Bard
أول منتج محادثة عام بالذكاء الاصطناعي من Google. لم يكن جيدًا.
-
ديسمبر 2023
Gemini 1
أول نموذج يحمل العلامة التجارية Gemini. مستويات Ultra وPro وNano.
-
فبراير 2024
Gemini 1.5 Pro
أول نافذة سياق بمليون رمز في الإنتاج.
-
ديسمبر 2024
Gemini 2
متعدد الوسائط أفضل، استنتاج أسرع، سعر أقل.
-
نوفمبر 2025
Gemini 3 Pro
سياق بمليون رمز، تفوق في الرؤية، تكامل مع Workspace يعمل أخيرًا.
ما يكلف
يكلف Gemini 3 Pro عبر AI Studio API دولارين لكل مليون رمز مدخل و12 دولارًا لكل مليون مخرج، وفق توثيق Gemini API من Google. يقع هذا السعر للمدخلات دون Opus 4.7 من Anthropic ($5) وفوق GPT-5 من OpenAI مباشرةً ($1.25) (متحقق من تسعير Google Cloud Vertex AI للاستخدام المؤسسي). للأعمال الكثيفة بالصور على نطاق واسع، الميزة السعرية ذات معنى: آلاف الصور يوميًا تتراكم بسرعة على أي نموذج.
| النموذج | المدخلات ($/مليون رمز) | المخرجات ($/مليون رمز) | الأفضل في |
|---|---|---|---|
| Gemini 3 Pro | $2 | $12 | الرؤية، Workspace |
| Claude Opus 4.7 | $5 | $25 | البرمجة، السياق الطويل، التحفظ الصادق |
| GPT-5 | $1.25 | $10 | التصميم البصري، الدفء المحادثاتي |
خطة Gemini Advanced الاستهلاكية بـ $20 شهريًا قرار واضح إذا كنت تعيش في Workspace. إذا كنت تفتح Workspace بضع مرات في الأسبوع فقط للمستندات المشتركة، تعامل مع التكامل كمزية إضافية وليس سبب الاشتراك. المستخدمون التقنيون سيستفيدون أكثر من مستوى API. لصورة التكلفة عبر جميع النماذج الحدّية والمتوسطة، راجع السعر لكل حالة استخدام.
الدور الذي ينبغي أن تضعه فيه
Gemini 3 Pro هو الأداة المناسبة لمهمة واحدة بعينها: أي شيء يجمع صورة مع سؤال. الفجوة مقارنة بالبدائل في فهم لقطات الشاشة، والرسوم اليدوية، والتعرف البصري على الحروف، وصور المستندات بالخط العربي كبيرة ومتسقة عبر السجل العام. لهذا العمل، هذا هو الاختيار الوحيد الصحيح في مطلع 2026.
للعمل العام (الكتابة، البرمجة، التفكير المنطقي الطويل) يُعدّ Gemini كفؤًا دون أن يتفوق على البدائل، وتفرض الرفضات ضريبة احتكاك فوق ذلك. التباين من جلسة إلى أخرى الذي يظهر في النقاشات المجتمعية هو نوع الخلل الذي ستصلحه Google على الأرجح في الإصدارات اللاحقة. إذا كان بإمكانك تشغيل نموذج واحد فقط، يظل Opus 4.7 الافتراضي الأفضل.
إذا كان بإمكانك تشغيل أكثر من نموذج، ضع Gemini 3 Pro في إعدادك كمرحلة الرؤية: وجّه لقطات الشاشة، وملفات PDF الممسوحة، ومستندات الخط العربي إليه، واترك كل شيء آخر لـ Claude أو GPT-5. هذا هو التصميم الذي يبدو أن سطح منتج Google يفترضه، ولعمل كثيف الصور هو أيضًا أرخص تقسيم يمكنك إعداده هذا الربع.