گوگل از قابلیت جدید Gemini 3.5 Live Translate خود رونمایی کرده که ترجمه صوتی همزمان و بیدرنگ مکالمات را با حفظ لحن و سرعت اصلی گوینده امکانپذیر میسازد.
گوگل سالهاست که در پی تحقق رویای ترجمه بیدرنگ بوده و اکنون با عرضه مدل جدید هوش مصنوعی جمنای ۳.۵ لایو ترنسلیت، مرزهای ترجمه صوتی را با سرعتی بیسابقه و در نقاط بیشتری از اکوسیستم خود گسترش داده است.
ویژگیهای پیشرفته و عملکرد بینظیر
مدل Gemini 3.5 Live Translate، بخشی از خانواده نسل ۳.۵ هوش مصنوعی گوگل، به صورت اختصاصی برای ترجمه گفتار به گفتار تنظیم شده و قادر به شناسایی و ترجمه خودکار بیش از ۷۰ زبان است.
این سیستم ترجمه صوتی همزمان، تنها چند ثانیه از گفتار اصلی عقب میماند و همزمان زیروبم صدا، سرعت و آهنگ کلام گوینده را حفظ میکند تا تجربهای کاملاً طبیعی و انسانی فراهم آورد.
- آنتروپیک هوش مصنوعی جنجالی «کلود فیبل 5» را عرضه عمومی کرد؛ خیلی راحت به یک هکر حرفهای تبدیل شوید!
- تجربه تماس و پیام در گوشیهای آیفون با هوش مصنوعی Apple Intelligence متحول شد
گوگل برای شفافیت، تمام جریانهای صوتی تولید شده توسط این قابلیت را با واترمارکهای SynthID نشانهگذاری میکند تا منشأ هوش مصنوعی آنها مشخص باشد.
دسترسی گسترده در اکوسیستم گوگل
این قابلیت پیشرفته در بخشهای مختلف اکوسیستم گوگل در دسترس قرار میگیرد. توسعهدهندگان میتوانند از طریق پیشنمایش عمومی در Gemini Live API و AI Studio با این مدل کار کنند؛ جمنای ۳.۵ لایو ترنسلیت به طور پیوسته گفتار را پردازش کرده، ورودیهای چندزبانه را خودکار مدیریت میکند و نویزهای پسزمینه را فیلتر میکند.
از همین ماه، مشتریان سازمانی منتخب نیز به این مدل جدید در گوگل میت دسترسی مییابند که پیشدرآمدی برای عرضه گستردهتر است. این ویژگی به زودی به اپلیکیشن گوگل ترنسلیت برای اندروید و آی او اس اضافه خواهد شد.
نکته قابل توجه این است که برای استفاده، دیگر نیازی به هدفون خاصی نیست و حتی حالت شنیدن (Listening Mode) به کاربران اندروید اجازه میدهد با نگه داشتن تلفن نزدیک گوش خود، ترجمه صوتی را دریافت کنند.
گجت نیوز آخرین اخبار تکنولوژی، علم و خودرو 

