هوش مصنوعی تقلید صدای ElevenLabs اکنون با پشتیبانی از 30 زبان مختلف، بیش از هر زمان دیگری اشتغال صداپیشگان را تهدید میکند.
دنیای هوشهای مصنوعی در حال گستردهتر شدن است و پس از طراحی لوگو با هوش مصنوعی ، نوبت به دوبله رسیده است! هوش مصنوعی ElevenLabs که با قابلیت تولید محتوای دیپفیک شناخته میشود، با گسترش پشتیبانی خود، امکان شبیهسازی صدا برای 22 زبان دیگر از جمله اوکراینی، کرهای، سوئی و عربی را به پلتفرم خود اضافه کرد. این مدل جدید که Multilingual v2 نام دارد، قادر به تولید صدایی با لحن و حس انسانی در 30 زبان مختلف است.
فناوری مذکور از دو ابزار صوتی هوش مصنوعی تشکیل میشود که اولی مدل تبدیل متن به گفتار و دومی فناوری VoiceLab نام دارد که به کاربران اجازه میدهد با وارد کردن قطعات گفتاری، صداها را شبیهسازی کنند. بهلطف مدل v2، صداهای تولید شده اکنون میتوانند به زبانهایی نظیر یونانی، مالایی و ترکی صحبت کنند.
سرویس جدید هوش مصنوعی ElevenLabs اخیرا در وبسایت شرکت سازنده منتشر شده است. کاربران برای استفاده از آن میبایست متن را به زبان مورد نظر خود وارد کنند، تا صدای ترجمه شده مربوطه را بشنوند که با کلونهای صوتی تولید شده توسط شرکت و نمونه خلق شده توسط کاربر سازگار است. در حالیکه ارزیابی کامل دقت صداهای تاکیدی برای گویندگان غیربومی چالشبرانگیز است، گفتار این مدل، ریتم طبیعی خود را با مکثهای تنفسی انجام میدهد.
هوش مصنوعی ElevenLabs پس از انتشار نسخه بتا، با جنجالهای فراوانی مواجه شد. چرا که برخی از این فناوری برای جعل هویت افراد مشهور و انتشار محتوای توهینآمیز استفاده کردند. این شرکت از آن زمان، اقداماتی را برای محدود کردن شبیهسازی صدا به صدای خود کاربران و تایید نمونهها از طریق کپچاهای متنی اجرا کرده است. ماتی استانیشفسکی، یکی از بنیانگذاران این شرکت و مدیر اجرایی سابق Palantir، اشاره کرد که این شرکت آرزو دارد از هوش مصنوعی برای از بین بردن موانع زبانی در تولید محتوا استفاده کند.
هوش مصنوعی ElevenLabs، جایگزین آینده صداپیشگان انسانی؟
علاوه بر گسترش پشتیبانی از زبانها، ElevenLabs در حال گذر از نسخه بتا، برای ارائه شبیهساز صوتی هوش مصنوعی برای نهادهای رسانهای است. این شرکت با سرمایهگذاری آندریسن هوروویتز و رئیس سابق دیپمایند، مصطفی سلیمان، با بودجه 19 میلیون دلار کار خود را آغاز کرد. هوش مصنوعی ElevenLabs همچنین قادر به ارائه فناوری خود برای خلق کتابهای صوتی و ویدیویی و انواع NPC صوتی در بازیهای ویدیویی است. با وجود نگرانیهای صداپیشگان از جایگزینی این فناوری، ElevenLabs مورد توجه ناشران مختلف نظیر Paradox Interactive قرار گرفته است.
در حالیکه گوگل و اپل در حال آزمایش کتابهای صوتی (Audiobook) با استفاده از هوش مصنوعی هستند، ElevenLabs بر این باور است که صدای تولید شده توسط AI میتواند در صرف زمان و هزینه شرکتهای انتشاراتی صرفهجویی کند. این شرکت طی همکاری با Lukeman Literary، موفق به اصلاح پردازش کتابهای صوتی و کاهش قابل توجه زمان ساخت آنها شده است.
بهگفته Lukeman Literary، تولید کتاب صوتی با استفاده از هوش مصنوعی، به دلیل هزینه کمتر میتواند به نفع نویسندگان مستقل باشد. با این حال، تاثیر این فناوری بر اشتغال صداپیشگان، هنوز محل نگرانی است. همانطور که صنعت انتشارات بیش از پیش به سمت هوش مصنوعی متمایل میشود، رقابت میان صداپیشگان انسانی و ماشینی فشردهتر از قبل میشود.