گوگل مدل هوش مصنوعی Gemini 2.5 Computer Use را با قابلیتهای وبگردی شبیه به انسان معرفی کرد. این مدل پیشرفته، اکنون برای توسعهدهندگان در دسترس عموم قرار گرفته است.
قابلیتهای برجسته Gemini 2.5 Computer Use
مدل Gemini 2.5 Computer Use میتواند اقدامات متنوعی نظیر کلیک کردن، تایپ، اسکرول، باز کردن منوهای کشویی و ناوبری در URLها را انجام دهد. این توانایی باعث شده که در معیارهایی چون Online-Mind2Web و WebVoyager و AndroidWorld از رقبای خود پیشی بگیرد و همزمان تأخیر کمتری داشته باشد.
نحوه عملکرد و ویژگیهای امنیتی
بر خلاف مدلهای سنتی مبتنی بر API، این هوش مصنوعی با پردازش اسکرینشاتهای رابطهای وب کار میکند. هر اقدام پیشنهادی توسط مدل قبل از اجرا توسط یک سرویس ایمنی بررسی میشود؛ همچنین، توسعهدهندگان میتوانند اقدامات پرخطر مانند تراکنشهای مالی را محدود یا نیازمند تأیید کاربر کنند. این مدل در حال حاضر ۱۳ اقدام را پشتیبانی میکند و برای مرورگرهای وب بهینه شده است.
- نانو بنانا به فتوشاپ آمد: بازتعریف خلاقیت با مدلهای هوش مصنوعی پیشرو گوگل و ادوبی
- گوگل Search Live منتشر شد؛ بدون نیاز به تایپ کردن گوگل برایتان جستجو میکند
- هوش مصنوعی گوگل جمنای وارد تلویزیون ها شد
دسترسی توسعهدهندگان و موارد استفاده
تیمهای داخلی گوگل از این مدل برای تست رابط کاربری و وظایف اتوماسیون در پلتفرمهایی مانند Search و Firebase بهره میبرند. توسعهدهندگان خارجی نیز در برنامه دسترسی زودهنگام، از جمنای ۲.۵ Computer Use برای ساخت ابزارهای اتوماسیون گردش کار و دستیارها استفاده کردهاند. علاقهمندان میتوانند از طریق Google AI Studio یا Vertex AI به این مدل دسترسی پیدا کنند.