ترجمه صوتی همزمان Gemini 3.5 Live Translate

گوگل از Gemini 3.5 Live Translate برای ترجمه صوتی همزمان رونمایی کرد

یک دیدگاه ارسال شده توسط: سارا بنی عامریان 20 خرداد 1405 ساعت 16:03

گوگل از قابلیت جدید Gemini 3.5 Live Translate خود رونمایی کرده که ترجمه صوتی همزمان و بی‌درنگ مکالمات را با حفظ لحن و سرعت اصلی گوینده امکان‌پذیر می‌سازد.

گوگل سال‌هاست که در پی تحقق رویای ترجمه بی‌درنگ بوده و اکنون با عرضه مدل جدید هوش مصنوعی جمنای ۳.۵ لایو ترنسلیت، مرزهای ترجمه صوتی را با سرعتی بی‌سابقه و در نقاط بیشتری از اکوسیستم خود گسترش داده است.

ویژگی‌های پیشرفته و عملکرد بی‌نظیر

مدل Gemini 3.5 Live Translate، بخشی از خانواده نسل ۳.۵ هوش مصنوعی گوگل، به صورت اختصاصی برای ترجمه گفتار به گفتار تنظیم شده و قادر به شناسایی و ترجمه خودکار بیش از ۷۰ زبان است.

این سیستم ترجمه صوتی همزمان، تنها چند ثانیه از گفتار اصلی عقب می‌ماند و همزمان زیروبم صدا، سرعت و آهنگ کلام گوینده را حفظ می‌کند تا تجربه‌ای کاملاً طبیعی و انسانی فراهم آورد.

بیشتر بخوانید

گوگل برای شفافیت، تمام جریان‌های صوتی تولید شده توسط این قابلیت را با واترمارک‌های SynthID نشانه‌گذاری می‌کند تا منشأ هوش مصنوعی آن‌ها مشخص باشد.

دسترسی گسترده در اکوسیستم گوگل

این قابلیت پیشرفته در بخش‌های مختلف اکوسیستم گوگل در دسترس قرار می‌گیرد. توسعه‌دهندگان می‌توانند از طریق پیش‌نمایش عمومی در Gemini Live API و AI Studio با این مدل کار کنند؛ جمنای ۳.۵ لایو ترنسلیت به طور پیوسته گفتار را پردازش کرده، ورودی‌های چندزبانه را خودکار مدیریت می‌کند و نویزهای پس‌زمینه را فیلتر می‌کند.

از همین ماه، مشتریان سازمانی منتخب نیز به این مدل جدید در گوگل میت دسترسی می‌یابند که پیش‌درآمدی برای عرضه گسترده‌تر است. این ویژگی به زودی به اپلیکیشن گوگل ترنسلیت برای اندروید و آی او اس اضافه خواهد شد.

نکته قابل توجه این است که برای استفاده، دیگر نیازی به هدفون خاصی نیست و حتی حالت شنیدن (Listening Mode) به کاربران اندروید اجازه می‌دهد با نگه داشتن تلفن نزدیک گوش خود، ترجمه صوتی را دریافت کنند.