سرویس ترجمه هوش مصنوعی متا میتواند در لحظه و بدون درنگ، صحبت افراد را با حفظ تن صدا و احساسات به زبان دیگری ترجمه کند.
در آگوست 2023 – که در دنیای هوش مصنوعی مانند چند قرن پیش بود! – کمپانی متا به ایجاد یک موتور ترجمه جهانی با کمک هوش مصنوعی یک گام نزدیکتر شد. در همان زمان بود که SealessM4T به عنوان سرویسی که میتوانست با کمک هوش مصنوعی عمل ترجمه را انجام بدهد پا به عرصه گذاشت. این سرویس قابلیت ترجمه هر فایل صوتی یا متنی را در 100 زبان مختلف را در خود داشت و حتی میتوانست به 36 زبان مختلف، آن متن را بخواند.
متا درباره SeeamlessM4T اینگونه توضیح میدهد:
ما بسیار مشتاقیم تا ببینیم این مدل بنیادین چگونه در آینده روی قابلیتهای ارتباطی تاثیر خواهد گذاشت. این سرویس انسانها را به یکدیگر نزدیک کرده و ما را به دنیایی وارد میکند که صحبت هر فردی قابل درک خواهد بود.
اما امروز متا از نسخه آپدیت شده سرویس ترجمهاش با نام SeamlessM4T v2 رونمایی کرده و ادعا میکند که این به روز رسانی امکان تشخیص خودکار مکالمات را دارد و میتواند به صورت محاورهای یا متنی صحبتهای شما را ترجمه کند. همچنین کاربر میتواند با نوشتن متن از سرویس بخواهد که ترجمه آن را به زبان دیگر به صورت محاورهای پخش کند. همچنین از دو هوش مصنوعی جدید در SeamlessM4T v2 کمک گرفته شده است: SeamlessStreaming و SeamlessExpressive.
ابزارهای ترجمه معمولی صبر میکنند تا صحبت کاربر تمام شود و سپس شروع به ترجمه گفتههای او خواهند کرد. این موضوع چالش اصول و قواعد زبانهای مختلف را از بین میبرد و در نهایت یک جمله صحیح از لحاظ ساختاری تحویل خواهد شد. در زبانهای مختلف ترتیب فاعل، مفعول و فعل با یکدیگر تفاوت دارد و حفظ ساختار صحیح جمله، به حفظ معنای آن نیز کمک شایانی میکند. با وجود تمام این مزایا، مشکل تاخیر در انجام ترجمه باعث میشود مکالمه افراد حالت مصنوعی و غیرطبیعی پیدا کند.
اما کاری که SeamlessStreaming انجام میدهد کاملا با ابزارهای ترجمه فعلی تفاوت دارد. این سرویس حتی زمانی که کاربر در حال صحبت کردن است ترجمه خود را انجام داده و پخش میکند. بدین ترتیب مخاطب تنها با تاخیر چند ثانیهای صحبتهای طرف مقابل را متوجه خواهد شد.
همچنین بخوانید:
متا با کمک ری بن، خاصترین عینک هوشمند خود را راهی بازار کرد
SeamlessExpressive بر خلاف Streaming، تمرکز کمتری روی محتوای صحبت دارد و بیشتر روی چگونگی بیان کاربر فوکوس میکند. این هوش مصنوعی برای حفظ ریتم، احساسات و مدل صحبت کردن کاربر بوده تا ترجمه حالتی طبیعیتر به خود بگیرد.
متا پس از یکپارچهسازی هوش مصنوعی SeamlessStreaming و SeamlessExpressive با سرویس ترجمه خود، Seamless، برای توسعه هرچه بیشتر و راحتتر دست به انتشار کدها، مدلها و دیتاستهای خود در گیت هاب زده تا توسعهدهندگان را برای بهتر کردن Seamless تشویق کند.
بخش پژوهشهای متا در این باره نوشت:
با انتشار عمومی کارهایمان، امیدواریم پژوهشگران و توسعهدهندگان بتوانند به ما در گسترده کردن این سرویس کمک کنند. با ساخت تکنولوژیهای جدید و اتصال زبانهای مختلف به یکدیگر، با سرعت بیشتری میتوانیم به سوی دنیای به هم پیوسته و یکپارچه حرکت کنیم.