گوگل در رویداد I/O 2025 خود با معرفی Gemini 2.5 Pro Deep Think، مدلهای OpenAI را شکست داد و با آپدیت Flash، مدعی پادشاهی هوش مصنوعی شد.
شرکت گوگل ساعاتی پیش در کنفرانس سالانه Google I/O، خبرهای جدیدی درباره مدلهای هوش مصنوعی Gemini 2.5 خود اعلام کرد. بخش اصلی این خبرها معرفی یک حالت پیشرفته به نام Gemini 2.5 Pro Deep Think بود. گفته میشود این حالت در مقایسه با جدیدترین مدلهای (سری o3 و o4) شرکت OpenAI، در آزمونهای استاندارد هوش مصنوعی نتایج بهتری کسب کرده است. این دستاورد نشان میدهد که گوگل در حال تبدیل شدن به یکی از پیشتازان اصلی در دنیای هوش مصنوعی است.
گوگل اعلام کرد که مدل اصلی Gemini 2.5 Pro، با اینکه اوایل این ماه بهروزرسانی مهمی دریافت کرده بود، فعلا بدون تغییر باقی میماند. با این حال، یک حالت جدید و پیشرفته برای استدلال به نام Deep Think به آن افزوده میشود. این حالت، قابلیتهای مدل Gemini 2.5 Pro را به سطح بالاتری میبرد. Deep Think از روشهای تحقیقی جدید استفاده میکند و پیش از پاسخگویی، چندین فرضیه (یا احتمال) را ارزیابی میکند. به این شکل، پاسخهای دقیقتر و عمیقتری ارائه میدهد.
Deep Think: غولی که رکوردها را جابجا میکند
- گوگل برای نشان دادن قدرت خیرهکننده Gemini 2.5 Pro Deep Think، سه بنچمارک کلیدی را به اشتراک گذاشت که همگی رکوردهای جدیدی در سطح جهانی (SOTA) محسوب میشوند و حتی از آخرین مدلهای سری o3 و o4 شرکت OpenAI نیز عملکرد بهتری داشتهاند:
- ۴۹.۴٪ در بنچمارکهای ریاضی USAMO سال ۲۰۲۵
- ۸۰.۴٪ در بنچمارک کدنویسی سطح مسابقات LiveCodeBench
- ۸۴.۰٪ در بنچمارک استدلال چندوجهی MMMU
در حال حاضر، Gemini 2.5 Pro Deep Think تنها از طریق Gemini API در دسترس آزمایشکنندگان مورد اعتماد گوگل قرار خواهد گرفت.
Gemini 2.5 Flash: سرعت و کارایی برای همه
گوگل همچنین از آخرین بهروزرسانی مدل اقتصادی و پرکاربرد خود، Gemini 2.5 Flash، پرده برداشت. این مدل جدید در تمامی بنچمارکها عملکرد بهتری نسبت به نسخه قبلی خود نشان داده و هماکنون برای پیشنمایش در اختیار توسعهدهندگان در Google AI Studio، شرکتها در Vertex AI و کاربران در اپلیکیشن Gemini قرار گرفته است. گوگل نسخه نهایی و تولیدی Gemini 2.5 Flash را در ماه ژوئن منتشر خواهد کرد.
تحولات هیجانانگیز برای توسعهدهندگان Gemini
در کنار بهروزرسانی مدلها، گوگل بهبودهای قابل توجهی را برای تجربه توسعهدهندگان Gemini معرفی کرد:
- پیشنمایش Live API جدید: با پشتیبانی از چندین گوینده، امکان تبدیل متن به گفتار با دو صدا از طریق خروجی صوتی نیتیو و قابلیتهای بیشتر
- پشتیبانی نیتیو SDK از تعاریف Model Context Protocol (MCP): در Gemini API برای یکپارچهسازی آسانتر با ابزارهای متنباز
- دسترسی عمومی به Gemini 2.5 Pro با thinking budgets: برای استفاده پایدار در محیط تولید طی هفتههای آینده
- ادغام قابلیتهای استفاده از کامپیوتر پروژه Mariner: در Gemini API و Vertex AI
- افزودن thought summaries: به مدلهای 2.5 Pro و Flash در Gemini API و Vertex AI
بدون شک معرفی Gemini 2.5 Pro Deep Think و سایر بهروزرسانیهای خانواده Gemini، گامی بلند و جسورانه از سوی گوگل در جهت تثبیت موقعیت خود به عنوان پیشرو در دنیای رقابتی هوش مصنوعی است.
با چنین قابلیتهای چشمگیری به نظر میرسد گوگل نه تنها قصد رقابت، بلکه سودای پادشاهی در این قلمرو را در سر میپروراند و آیندهای را نوید میدهد که هوش مصنوعی گوگل در آن نقش محوری خواهد داشت.