هوش مصنوعی ElevenLabs صدای شما را به 30 زبان زنده تقلید می‌کند

یک دیدگاه ارسال شده توسط: امیرحسین خرمی 02 شهریور 1402 ساعت 12:20

هوش مصنوعی تقلید صدای ElevenLabs اکنون با پشتیبانی از 30 زبان مختلف، بیش از هر زمان دیگری اشتغال صداپیشگان را تهدید می‌کند.

دنیای هوش‌های مصنوعی در حال گسترده‌تر شدن است و پس از طراحی لوگو با هوش مصنوعی ، نوبت به دوبله رسیده است! هوش مصنوعی ElevenLabs که با قابلیت تولید محتوای دیپ‌فیک شناخته می‌شود، با گسترش پشتیبانی خود، امکان شبیه‌سازی صدا برای 22 زبان دیگر از جمله اوکراینی، کره‌ای، سوئی و عربی را به پلتفرم خود اضافه کرد. این مدل جدید که Multilingual v2 نام دارد، قادر به تولید صدایی با لحن و حس انسانی در 30 زبان مختلف است.

فناوری مذکور از دو ابزار صوتی هوش مصنوعی تشکیل می‌شود که اولی مدل تبدیل متن به گفتار و دومی فناوری VoiceLab نام دارد که به کاربران اجازه می‌دهد با وارد کردن قطعات گفتاری، صداها را شبیه‌سازی کنند. به‌لطف مدل v2، صداهای تولید شده اکنون می‌توانند به زبان‌هایی نظیر یونانی، مالایی و ترکی صحبت کنند.

سرویس جدید هوش مصنوعی ElevenLabs اخیرا در وب‌سایت شرکت سازنده منتشر شده است. کاربران برای استفاده از آن می‌بایست متن را به زبان مورد نظر خود وارد کنند، تا صدای ترجمه شده مربوطه را بشنوند که با کلون‌های صوتی تولید شده توسط شرکت و نمونه خلق شده توسط کاربر سازگار است. در حالی‌که ارزیابی کامل دقت صداهای تاکیدی برای گویندگان غیربومی چالش‌برانگیز است، گفتار این مدل، ریتم طبیعی خود را با مکث‌های تنفسی انجام می‌دهد.

هوش مصنوعی ElevenLabs پس از انتشار نسخه بتا، با جنجال‌های فراوانی مواجه شد. چرا که برخی از این فناوری برای جعل هویت افراد مشهور و انتشار محتوای توهین‌آمیز استفاده کردند. این شرکت از آن زمان، اقداماتی را برای محدود کردن شبیه‌سازی صدا به صدای خود کاربران و تایید نمونه‌ها از طریق کپچاهای متنی اجرا کرده است. ماتی استانیشفسکی، یکی از بنیان‌گذاران این شرکت و مدیر اجرایی سابق Palantir، اشاره کرد که این شرکت آرزو دارد از هوش مصنوعی برای از بین بردن موانع زبانی در تولید محتوا استفاده کند.

هوش مصنوعی ElevenLabs، جایگزین آینده صداپیشگان انسانی؟

علاوه بر گسترش پشتیبانی از زبان‌ها، ElevenLabs در حال گذر از نسخه بتا، برای ارائه شبیه‌ساز صوتی هوش مصنوعی برای نهادهای رسانه‌ای است. این شرکت با سرمایه‌گذاری آندریسن هوروویتز و رئیس سابق دیپ‌مایند، مصطفی سلیمان، با بودجه 19 میلیون دلار کار خود را آغاز کرد. هوش مصنوعی ElevenLabs هم‌چنین قادر به ارائه فناوری خود برای خلق کتاب‌های صوتی و ویدیویی و انواع NPC صوتی در بازی‌های ویدیویی است. با وجود نگرانی‌های صداپیشگان از جایگزینی این فناوری، ElevenLabs مورد توجه ناشران مختلف نظیر Paradox Interactive قرار گرفته است.

در حالی‌که گوگل و اپل در حال آزمایش کتاب‌های صوتی (Audiobook) با استفاده از هوش مصنوعی هستند، ElevenLabs بر این باور است که صدای تولید شده توسط AI می‌تواند در صرف زمان و هزینه شرکت‌های انتشاراتی صرفه‌جویی کند. این شرکت طی همکاری با Lukeman Literary، موفق به اصلاح پردازش کتاب‌های صوتی و کاهش قابل توجه زمان ساخت آنها شده است.

به‌گفته Lukeman Literary، تولید کتاب صوتی با استفاده از هوش مصنوعی، به‌ دلیل هزینه کم‌تر می‌تواند به نفع نویسندگان مستقل باشد. با این حال، تاثیر این فناوری بر اشتغال صداپیشگان، هنوز محل نگرانی است. همان‌طور که صنعت انتشارات بیش از پیش به سمت هوش مصنوعی متمایل می‌شود، رقابت میان صداپیشگان انسانی و ماشینی فشرده‌تر از قبل می‌شود.