هوش مصنوعی متا

تماشا کنید: ترجمه همزمان با هوش مصنوعی متا، مترجم‌ها را بیکار می‌کند

سرویس ترجمه هوش مصنوعی متا می‌تواند در لحظه و بدون درنگ، صحبت افراد را با حفظ تن صدا و احساسات به زبان دیگری ترجمه کند.

در آگوست 2023 – که در دنیای هوش مصنوعی مانند چند قرن پیش بود! – کمپانی متا به ایجاد یک موتور ترجمه جهانی با کمک هوش مصنوعی یک گام نزدیک‌تر شد. در همان زمان بود که SealessM4T به عنوان سرویسی که می‌توانست با کمک هوش مصنوعی عمل ترجمه را انجام بدهد پا به عرصه گذاشت. این سرویس قابلیت ترجمه هر فایل صوتی یا متنی را در 100 زبان مختلف را در خود داشت و حتی می‌توانست به 36 زبان مختلف، آن متن را بخواند.

متا درباره SeeamlessM4T این‌گونه توضیح می‌دهد:

ما بسیار مشتاقیم تا ببینیم این مدل بنیادین چگونه در آینده روی قابلیت‌های ارتباطی تاثیر خواهد گذاشت. این سرویس انسان‌ها را به یکدیگر نزدیک کرده و ما را به دنیایی وارد می‌کند که صحبت هر فردی قابل درک خواهد بود.

اما امروز متا از نسخه آپدیت شده سرویس ترجمه‌اش با نام SeamlessM4T v2 رونمایی کرده و ادعا می‌کند که این به روز رسانی امکان تشخیص خودکار مکالمات را دارد و می‌تواند به صورت محاوره‌ای یا متنی صحبت‌های شما را ترجمه کند. همچنین کاربر می‌تواند با نوشتن متن از سرویس بخواهد که ترجمه آن را به زبان دیگر به صورت محاوره‌ای پخش کند. همچنین از دو هوش مصنوعی جدید در SeamlessM4T v2 کمک گرفته شده است: SeamlessStreaming و SeamlessExpressive.

ابزارهای ترجمه معمولی صبر می‌کنند تا صحبت کاربر تمام شود و سپس شروع به ترجمه گفته‌های او خواهند کرد. این موضوع چالش اصول و قواعد زبان‌های مختلف را از بین می‌برد و در نهایت یک جمله صحیح از لحاظ ساختاری تحویل خواهد شد. در زبان‌های مختلف ترتیب فاعل،‌ مفعول و فعل با یکدیگر تفاوت دارد و حفظ ساختار صحیح جمله، به حفظ معنای آن نیز کمک شایانی می‌کند. با وجود تمام این مزایا، مشکل تاخیر در انجام ترجمه باعث می‌شود مکالمه افراد حالت مصنوعی و غیرطبیعی پیدا کند.

هوش مصنوعی متا

اما کاری که SeamlessStreaming انجام می‌دهد کاملا با ابزارهای ترجمه فعلی تفاوت دارد. این سرویس حتی زمانی که کاربر در حال صحبت کردن است ترجمه خود را انجام داده و پخش می‌کند. بدین ترتیب مخاطب تنها با تاخیر چند ثانیه‌ای صحبت‌های طرف مقابل را متوجه خواهد شد.

همچنین بخوانید:

متا با کمک ری بن، خاص‌ترین عینک هوشمند خود را راهی بازار کرد

SeamlessExpressive بر خلاف Streaming، تمرکز کمتری روی محتوای صحبت دارد و بیشتر روی چگونگی بیان کاربر فوکوس می‌کند. این هوش مصنوعی برای حفظ ریتم، احساسات و مدل صحبت کردن کاربر بوده تا ترجمه حالتی طبیعی‌تر به خود بگیرد.

متا پس از یکپارچه‌سازی هوش مصنوعی SeamlessStreaming و SeamlessExpressive با سرویس ترجمه خود، Seamless، برای توسعه هرچه بیشتر و راحت‌تر دست به انتشار کدها، مدل‌ها و دیتاست‌های خود در گیت هاب زده تا توسعه‌دهندگان را برای بهتر کردن Seamless تشویق کند.

بخش پژوهش‌های متا در این باره نوشت:

با انتشار عمومی کارهایمان، امیدواریم پژوهشگران و توسعه‌دهندگان بتوانند به ما در گسترده کردن این سرویس کمک کنند. با ساخت تکنولوژی‌های جدید و اتصال زبان‌های مختلف به یکدیگر، با سرعت بیشتری می‌توانیم به سوی دنیای به هم پیوسته و یکپارچه حرکت کنیم.