گوگل با Gemini 2.5 Pro Deep Think، پادشاه هوش مصنوعی می‌شود

0 ارسال شده توسط: پریسا فولادی 31 اردیبهشت 1404 ساعت 18:59

گوگل در رویداد I/O 2025 خود با معرفی Gemini 2.5 Pro Deep Think، مدل‌های OpenAI را شکست داد و با آپدیت Flash، مدعی پادشاهی هوش مصنوعی شد.

شرکت گوگل ساعاتی پیش در کنفرانس سالانه Google I/O، خبرهای جدیدی درباره مدل‌های هوش مصنوعی Gemini 2.5 خود اعلام کرد. بخش اصلی این خبرها معرفی یک حالت پیشرفته به نام Gemini 2.5 Pro Deep Think بود. گفته می‌شود این حالت در مقایسه با جدیدترین مدل‌های (سری o3 و o4) شرکت OpenAI، در آزمون‌های استاندارد هوش مصنوعی نتایج بهتری کسب کرده است. این دستاورد نشان می‌دهد که گوگل در حال تبدیل شدن به یکی از پیشتازان اصلی در دنیای هوش مصنوعی است.

گوگل اعلام کرد که مدل اصلی Gemini 2.5 Pro، با اینکه اوایل این ماه به‌روزرسانی مهمی دریافت کرده بود، فعلا بدون تغییر باقی می‌ماند. با این حال، یک حالت جدید و پیشرفته برای استدلال به نام Deep Think به آن افزوده می‌شود. این حالت، قابلیت‌های مدل Gemini 2.5 Pro را به سطح بالاتری می‌برد. Deep Think از روش‌های تحقیقی جدید استفاده می‌کند و پیش از پاسخگویی، چندین فرضیه (یا احتمال) را ارزیابی می‌کند. به این شکل، پاسخ‌های دقیق‌تر و عمیق‌تری ارائه می‌دهد.

Deep Think: غولی که رکوردها را جابجا می‌کند

گوگل برای نشان دادن قدرت خیره‌کننده Gemini 2.5 Pro Deep Think، سه بنچمارک کلیدی را به اشتراک گذاشت که همگی رکوردهای جدیدی در سطح جهانی (SOTA) محسوب می‌شوند و حتی از آخرین مدل‌های سری o3 و o4 شرکت OpenAI نیز عملکرد بهتری داشته‌اند:
۴۹.۴٪ در بنچمارک‌های ریاضی USAMO سال ۲۰۲۵
۸۰.۴٪ در بنچمارک کدنویسی سطح مسابقات LiveCodeBench
۸۴.۰٪ در بنچمارک استدلال چندوجهی MMMU

در حال حاضر، Gemini 2.5 Pro Deep Think تنها از طریق Gemini API در دسترس آزمایش‌کنندگان مورد اعتماد گوگل قرار خواهد گرفت.

Gemini 2.5 Flash: سرعت و کارایی برای همه

گوگل همچنین از آخرین به‌روزرسانی مدل اقتصادی و پرکاربرد خود، Gemini 2.5 Flash، پرده برداشت. این مدل جدید در تمامی بنچمارک‌ها عملکرد بهتری نسبت به نسخه قبلی خود نشان داده و هم‌اکنون برای پیش‌نمایش در اختیار توسعه‌دهندگان در Google AI Studio، شرکت‌ها در Vertex AI و کاربران در اپلیکیشن Gemini قرار گرفته است. گوگل نسخه نهایی و تولیدی Gemini 2.5 Flash را در ماه ژوئن منتشر خواهد کرد.

تحولات هیجان‌انگیز برای توسعه‌دهندگان Gemini

در کنار به‌روزرسانی مدل‌ها، گوگل بهبودهای قابل توجهی را برای تجربه توسعه‌دهندگان Gemini معرفی کرد:

پیش‌نمایش Live API جدید: با پشتیبانی از چندین گوینده، امکان تبدیل متن به گفتار با دو صدا از طریق خروجی صوتی نیتیو و قابلیت‌های بیشتر
پشتیبانی نیتیو SDK از تعاریف Model Context Protocol (MCP): در Gemini API برای یکپارچه‌سازی آسان‌تر با ابزارهای متن‌باز
دسترسی عمومی به Gemini 2.5 Pro با thinking budgets: برای استفاده پایدار در محیط تولید طی هفته‌های آینده
ادغام قابلیت‌های استفاده از کامپیوتر پروژه Mariner: در Gemini API و Vertex AI
افزودن thought summaries: به مدل‌های 2.5 Pro و Flash در Gemini API و Vertex AI

بدون شک معرفی Gemini 2.5 Pro Deep Think و سایر به‌روزرسانی‌های خانواده Gemini، گامی بلند و جسورانه از سوی گوگل در جهت تثبیت موقعیت خود به عنوان پیشرو در دنیای رقابتی هوش مصنوعی است.

با چنین قابلیت‌های چشمگیری به نظر می‌رسد گوگل نه تنها قصد رقابت، بلکه سودای پادشاهی در این قلمرو را در سر می‌پروراند و آینده‌ای را نوید می‌دهد که هوش مصنوعی گوگل در آن نقش محوری خواهد داشت.