مراجعة Gemini 3.5 Flash

طبقة رائدة رخيصة لمسارات الوكلاء، وسريعة في الإخراج، ومسعّرة لتقويض Pro. فقط لا تخلطها مع Flash القديم منخفض التكلفة.

· عرض سجل التغييرات · تُحقّقت الأرقام من المصادر الرسمية في 30 مايو 2026

مسارات الوكلاء هي المكان الذي تموت فيه فواتير الرموز. وكيل برمجة يخطط ويستدعي الأدوات ويقرأ النتائج ويعيد المحاولة قد يحرق ملايين الرموز في تذكرة واحدة، والنموذج الذي تختاره يتضاعف مع كل خطوة. هذه المشكلة الاقتصادية هي بالضبط ما استهدفته Google بـ Gemini 3.5 Flash: نموذج سريع ورخيص بما يكفي ليجلس داخل مسار تشغله آلاف المرات يومياً، لكنه قوي بما يكفي ألا ينهار في الخطوات الصعبة. كن دقيقاً في كلمة “رخيص”. Gemini 3.5 Flash رخيص مقارنة بـ Pro ونماذج الاستدلال الرائدة. ليس رخيصاً مقارنة بطبقة Flash التي يستبدلها، والتي كانت تكلف نحو الثلث. “أرخص من Pro” و“رخيص” ادعاءان مختلفان، والأول فقط هو الصحيح.

جعلت Google هذا التوفر العام رسمياً في I/O في 19 مايو 2026، وهو مؤكد في سجل تغييرات Gemini API، والطرح محدد على نحو غير معتاد: هذا Flash يتفوق على الطبقة المميزة السابقة في المعايير التي تهتم بها Google، بسرعة Flash وتكلفة Flash. الأرقام أدناه من Google نفسها، فاقرأها مع هذا التحفظ. لكن شكل العرض واضح، وهو يغير حساب ما تستطيع أتمتته.

الإدخال القياسي / 1M $1.50 الإخراج $9 / 1M؛ قراءة الإدخال المخبأ $0.15 / 1M
سرعة الإخراج مقابل الرائد ادعاء Google؛ لا يوجد رقم رموز/ثانية مطلق مؤكد
مقابل إدخال Flash السابق كان Gemini 3 Flash نحو $0.50 / $3؛ هذه الطبقة أغلى
سعة سياق الإدخال 1M 1,000,000 رمز إدخال، و65,536 رمز إخراج

التسعير، بقراءة صريحة

ابدأ بالأرقام الرسمية، لأن كلمة التسويق “رخيص” تؤدي عملاً خفياً كثيراً. في الطبقة المدفوعة القياسية، وفق صفحة تسعير Gemini API من Google، يكلف Gemini 3.5 Flash $1.50 لكل مليون رمز إدخال و$9 لكل مليون إخراج. قراءة الإدخال المخبأ تنخفض إلى $0.15 لكل مليون، وتخزين التخزين المؤقت يكلف $1 لكل مليون رمز في الساعة. نفذ العمل نفسه عبر طبقة batch أو flex فينخفض السعر إلى النصف: $0.75 إدخال و$4.50 إخراج. توجد أيضاً طبقة مجانية: الإدخال والإخراج وتخزين السياق المؤقت بلا رسوم ضمن حدود المعدلات، ما يجعل بناء النموذج الأولي بلا تكلفة قبل الالتزام.

الآن حاجز الصراحة. ضع هذه الأسعار بجانب نماذج Flash السابقة. كان Gemini 3 Flash يدور حول $0.50 إدخال و$3 إخراج. وكان Gemini 2.5 Flash-Lite حول $0.10 إدخال و$0.40 إخراج. لذلك يكلف هذا الجيل من Flash نحو ثلاثة أضعاف سعر الإدخال في الجيل الذي سبقه، وأكثر من عشرة أضعاف Flash-Lite القديم. قال عدة معلقين الأمر بصراحة: Flash لم يعد طبقة الميزانية. ما تشتريه بهذا السعر الأعلى هو نموذج تزعم Google أنه في نقاش Pro من الجيل السابق، لا طبقة العمل الرخيصة جداً التي كان الاسم يوحي بها.

في مسارات الوكلاء، سعر الرمز نصف القصة فقط. تقول Google إن المهام غالباً تنتهي بأقل من نصف تكلفة طبقة Pro السابقة، جزئياً لأن النموذج أسرع وجزئياً لأن مستوى التفكير الافتراضي انخفض من “عالٍ” إلى “متوسط”، فينفق رموزاً أقل في التأمل في الخطوات الروتينية. رموز إخراج أقل لكل مهمة، بسعر إخراج أقل، تتراكم. حساب ما إذا كانت هذه الرياضيات تتفوق على بديل بسعر ثابت لمهمتك المحددة هو بالضبط سبب وجود تفصيل السعر حسب حالة الاستخدام في benchr، وإذا كانت مساراتك تنتفخ بسياقها الخاص، فإن تكتيكات خفض استخدام الرموز تهم هنا أكثر من نموذج تستدعيه مرة واحدة.

ما تقول Google إنه يستطيع فعله

حجة دفع أكثر من سعر Flash القديم تقوم على المعايير، وهذه نتائج طرف أول: Google أجرتها وGoogle تذكرها. قد تصل اللوحات المستقلة إلى مكان آخر، لذلك تعامل مع الجدول كأرقام بائع إلى أن تتدخل أطراف ثالثة. مع هذا التحفظ، الأرقام لافتة بالنسبة إلى نموذج Flash.

معايير Gemini 3.5 Flash الرئيسية، كلها مبلّغة من Google (طرف أول)
المعيارالنتيجةما يقيسه
Terminal-Bench 2.176.2%مهام برمجة ووكلاء داخل الطرفية
GDPval-AA1656 Eloمهام وكلاء من العالم الحقيقي
MCP Atlas83.6%موثوقية استخدام الأدوات
CharXiv Reasoning84.2%فهم الرسوم متعددة الوسائط

الخيط المشترك هو الوكلاء. Terminal-Bench وMCP Atlas يختبران ما إذا كان النموذج يستطيع قيادة الأدوات والتعافي من أخطائه عبر خطوات كثيرة، وهي نقطة الفشل التي تغرق النماذج الرخيصة في الإنتاج. نتيجة 76.2% على Terminal-Bench 2.1 و83.6% في موثوقية استخدام الأدوات هي من النوع الذي، إذا صمد خارج أدوات Google، يعني أنك تستطيع ترك المسار يستمر بدلاً من مراقبته. ورقم CharXiv يقول إنه يقرأ الرسوم والأشكال بكفاءة أيضاً، لذلك العمل الوكيلي متعدد الوسائط مطروح، لا النص فقط.

حدّان يجب إبقاؤهما في الصورة. تذكر Google ادعاء “أسرع 4x” أمام نماذج رائدة أخرى لكنها لم تنشر رقم رموز في الثانية مطلقاً، لذلك السرعة حقيقية وفق Google لكنها ليست مثبتة برقم صلب تبني عليه مواصفة. وحد المعرفة هو يناير 2025 في الوثائق الرسمية. قال ملخص خارجي واحد يناير 2026؛ الرقم الرسمي هو الذي تثق به، ما يعني أن أي شيء أحدث من أوائل 2025 يحتاج grounding عبر Search أو استرجاعك الخاص.

بماذا يتصل وأين يعمل

في العمل الوكيلي، قائمة الأدوات تهم بقدر المعايير. يدعم Gemini 3.5 Flash Google Search grounding وGrounding with Google Maps وFile Search وCode Execution وURL Context وFunction Calling. الفجوة اللافتة هي Computer Use، فهو غير مدعوم، لذلك إذا احتاج وكيلك النقر داخل شاشة بدلاً من استدعاء API، فهذا ليس النموذج لتلك الخطوة.

الوصول واسع منذ اليوم الأول. يحصل عليه المطورون عبر Gemini API في Google AI Studio وAndroid Studio وGoogle Antigravity، منصة Google الموجهة للوكلاء أولاً، إضافة إلى Vertex AI للإنتاج. وتحصل المؤسسات عليه عبر Gemini Enterprise وGemini Enterprise Agent Platform. ويلتقي به المستهلكون داخل تطبيق Gemini وAI Mode في Google Search. كما أن طبقة API المجانية تعني أنك تستطيع ربط مسار كامل واختباره بلا فاتورة، ثم الانتقال إلى الأسعار المدفوعة عندما يبرر الحجم ذلك.

الطرح ليس روبوت دردشة أذكى. بل نموذج رخيص وسريع بما يكفي لتتركه يعمل.

كيف يقف أمام البدائل

إذا كنت تختار داخل تشكيلة Google نفسها، فالمقارنة مع Gemini 3.1 Pro، والحساب مباشر: تقول Google إن Flash يتفوق عليه في معايير الوكلاء والبرمجة مع تكلفة أقل وسرعة أعلى، لذلك في عمل الوكلاء عالي الحجم يصبح Flash هو الافتراضي، ويصبح Pro النموذج الذي تصعّد إليه لأصعب استدلال. خارج Google، المنافس الطبيعي لمقعد الوكلاء الرخيص والقادر هو طبقة Anthropic الصغيرة. من يوازن هذا أمام Claude Haiku 4.5 يجب أن يقارن على المسار نفسه الذي يشغله، لأن موثوقية استخدام الأدوات وإنفاق الرموز لكل مهمة، لا سعر الملصق، هما ما يحددان الأرخص في الإنتاج.

النقطة الأوسع أن “Flash” كفئة صعدت إلى سوق أعلى. كان يعني أرخص ما تبيعه Google؛ الآن يعني الطرف الرخيص من الطبقة الرائدة. هذا التموضع الجديد هو سبب ارتفاع السعر، وهو سبب أن مجموعة المقارنة الصحيحة هي Pro والنماذج المتوسطة القادرة، لا نماذج الميزانية. إذا كانت حاجتك الحقيقية هي القاع المطلق في التكلفة، فهذا الجيل من Flash ليس هو.

الحكم النهائي

يستحق Gemini 3.5 Flash تقييمه بسبب ملاءمته. كنموذج تضعه داخل مسارات البرمجة والوكلاء طويلة الأفق، فإن مزيج معايير وكلاء تقول Google إنها تتفوق على Pro، وسرعة إخراج تقارب 4x، وسعر أقل من Pro، وطبقة مجانية للنمذجة الأولية، حزمة قوية، وتدعمها سعة 1M ومجموعة كاملة من التكاملات والأدوات. كون المعايير من الطرف الأول هو العلامة الرئيسية؛ انتظر اللوحات المستقلة قبل الرهان على مسار حرج على الأرقام الدقيقة.

اختر Gemini 3.5 Flash إذا كنت تشغل عملاً وكيلياً أو برمجياً عالي الحجم وكنت ستصل إلى نموذج Pro لا تحتاجه بدقة، لأنك هنا تحصل على معظم القدرة بتكلفة أقل وسرعة أعلى. تجاوزه إذا كان عبء عملك سعيداً على Flash القديم بنحو $0.50/$3 ولا يحتاج القوة الوكيلية الجديدة، لأن هذا ارتفاع سعر حقيقي لتلك الحالة. والتزم بنموذج استدلال رائد عندما تكون المهمة استدلالاً صعباً بضربة واحدة لا مسار خطوات متوسطة، حيث تتفوق القدرة الخام على اقتصاديات الإنتاجية. للعمل الذي بُني من أجله، هذا أحد أفضل المقاعد قيمة على اللوحة الآن.

الأسئلة الشائعة

كم يكلف Gemini 3.5 Flash؟

الطبقة المدفوعة القياسية هي $1.50 لكل مليون رمز إدخال و$9.00 لكل مليون رمز إخراج، مع قراءة الإدخال المخبأ عند $0.15 لكل مليون، وفق صفحة تسعير Google الرسمية. طبقتا batch وflex تخفضان ذلك تقريباً إلى النصف: $0.75 إدخال و$4.50 إخراج. توجد أيضاً طبقة API مجانية يكون فيها الإدخال والإخراج وتخزين السياق المؤقت بلا رسوم ضمن حدود المعدلات.

هل Gemini 3.5 Flash رخيص؟

يعتمد ذلك على المقارنة. أمام Pro ونماذج الاستدلال الرائدة هو رخيص. أمام طبقات Flash السابقة ليس كذلك: كان Gemini 3 Flash نحو $0.50 إدخال و$3 إخراج، وكان Gemini 2.5 Flash-Lite نحو $0.10 إدخال و$0.40 إخراج، لذلك هذا الجيل يقارب ثلاثة أضعاف سعر Flash السابق. أشار عدة معلقين إلى أن Flash لم يعد خيار الميزانية كما كان. تعامل معه كنموذج رائد رخيص، لا كنموذج صغير رخيص.

هل يتفوق Gemini 3.5 Flash على Gemini 3.1 Pro في البرمجة؟

هذا ادعاء Google، والأرقام الرئيسية نتائج Google نفسها. تذكر Google أن Terminal-Bench 2.1 عند 76.2% وGDPval-AA عند 1656 Elo وMCP Atlas عند 83.6% وCharXiv Reasoning عند 84.2%، وتضع 3.5 Flash كمتفوق على طبقة 3.1 Pro السابقة في البرمجة والعمل الوكيلي بسرعة Flash. قد تختلف اللوحات المستقلة، فاقرأ هذه الأرقام كأرقام بائع إلى أن تؤكدها أطراف ثالثة.

ما سعة السياق وحد المعرفة؟

لدى Gemini 3.5 Flash سعة إدخال 1,000,000 رمز وحد إخراج أقصى 65,536 رمزاً، وكلاهما مؤكد في وثائق Google الرسمية. حد المعرفة مذكور كيناير 2025 في الوثائق الرسمية. ذكر ملخص خارجي واحد يناير 2026، لكن الرقم الرسمي هو يناير 2025.

بماذا يستطيع Gemini 3.5 Flash الاتصال؟

يدعم Google Search grounding وGrounding with Google Maps وFile Search وCode Execution وURL Context وFunction Calling. لا يدعم Computer Use. يمكن الوصول إليه عبر Gemini API في Google AI Studio وAndroid Studio وGoogle Antigravity، إضافة إلى Vertex AI وGemini Enterprise وتطبيق Gemini للمستهلكين وAI Mode في Google Search.

سجل التغييرات

  • 30 مايو 2026 — نُشر أول مرة. تم التحقق من تسعير $1.50/$9 القياسي وطبقتي batch وflex والطبقة المجانية وسعة 1M وحد الإخراج 65,536 رمزاً والأدوات المدعومة وتاريخ التوفر العام 19 مايو 2026 مقابل صفحة تسعير Gemini API من Google ووثائق “ما الجديد في Gemini 3.5” وسجل تغييرات Gemini API. أرقام المعايير الأربعة الرئيسية نتائج طرف أول من Google، وموسومة كأرقام بائع. أُشير إلى مقارنة أسعار Flash السابق من تقارير معاصرة؛ وحد المعرفة مذكور كيناير 2025 وفق الوثائق الرسمية.

المراجع

  1. Google, "Gemini 3.5," blog.google, 19 مايو 2026.
  2. Google, "Gemini API pricing," ai.google.dev/gemini-api/docs/pricing, اطُّلع عليه في مايو 2026.
  3. Google, "What's new in Gemini 3.5," ai.google.dev, اطُّلع عليه في مايو 2026.
  4. Google, "Gemini API changelog," ai.google.dev/gemini-api/docs/changelog, اطُّلع عليه في مايو 2026.
  5. MarkTechPost, "Google introduces Gemini 3.5 Flash at I/O 2026," marktechpost.com, 20 مايو 2026.