Excoino
Gemini 2.5 Computer Use

گوگل مدل هوش مصنوعی Gemini 2.5 Computer Use را با قابلیت‌های وبگردی انسانی عرضه کرد

گوگل مدل هوش مصنوعی Gemini 2.5 Computer Use را با قابلیت‌های وبگردی شبیه به انسان معرفی کرد. این مدل پیشرفته، اکنون برای توسعه‌دهندگان در دسترس عموم قرار گرفته است.

قابلیت‌های برجسته Gemini 2.5 Computer Use

مدل Gemini 2.5 Computer Use می‌تواند اقدامات متنوعی نظیر کلیک کردن، تایپ، اسکرول، باز کردن منوهای کشویی و ناوبری در URLها را انجام دهد. این توانایی باعث شده که در معیارهایی چون Online-Mind2Web و WebVoyager و AndroidWorld از رقبای خود پیشی بگیرد و هم‌زمان تأخیر کمتری داشته باشد.

Gemini 2.5 Computer Use

نحوه عملکرد و ویژگی‌های امنیتی

بر خلاف مدل‌های سنتی مبتنی بر API، این هوش مصنوعی با پردازش اسکرین‌شات‌های رابط‌های وب کار می‌کند. هر اقدام پیشنهادی توسط مدل قبل از اجرا توسط یک سرویس ایمنی بررسی می‌شود؛ همچنین، توسعه‌دهندگان می‌توانند اقدامات پرخطر مانند تراکنش‌های مالی را محدود یا نیازمند تأیید کاربر کنند. این مدل در حال حاضر ۱۳ اقدام را پشتیبانی می‌کند و برای مرورگرهای وب بهینه شده است.

بیشتر بخوانید

دسترسی توسعه‌دهندگان و موارد استفاده

تیم‌های داخلی گوگل از این مدل برای تست رابط کاربری و وظایف اتوماسیون در پلتفرم‌هایی مانند Search و Firebase بهره می‌برند. توسعه‌دهندگان خارجی نیز در برنامه دسترسی زودهنگام، از جمنای ۲.۵ Computer Use برای ساخت ابزارهای اتوماسیون گردش کار و دستیارها استفاده کرده‌اند. علاقه‌مندان می‌توانند از طریق Google AI Studio یا Vertex AI به این مدل دسترسی پیدا کنند.

پاسخ بدهید

وارد کردن نام و ایمیل اجباری است | در سایت ثبت نام کنید یا وارد شوید و بدون وارد کردن مشخصات نظر خود را ثبت کنید *

*