هوش مصنوعی VALL-E مایکروسافت ابزاری جذاب و در عین حال ترسناک است که علاوه بر تقلید دقیق صدا، میتواند لحن و احساسات گوینده را نیز بازتولید کند.
فناوریهای مبتنی بر هوش مصنوعی با سرعتی باورنکردنی در حال توسعه هستند. پس از رونمایی از مدلهای AI که میتوانند از کلمات تصویر بسازند و با شما وارد گفتگو شوند، هوش مصنوعی موسوم به VALL-E مایکروسافت میتواند به تقلید هر نوع صدایی، تنها در عرض 3 ثانیه بپردازد. برخلاف بسیاری از ابزارهای هوش مصنوعی، VALL-E میتواند احساسات و لحن گوینده را نیز بازتولید کند.
VALL-E: هوش مصنوعی مایکروسافت که میتواند هر صدایی را تقلید کند
هوش مصنوعی VALL-E مایکروسافت میتواند صدای افراد را بهطور کامل بازتولید و تکرار کند. این ابزار از ضبط 3 ثانیهای یک صدای خاص بهعنوانی پیامی برای تولید محتوا استفاده میکند و بر روی 60 هزار ساعت داده گفتار انگلیسی تسلط دارد. این مدل AI همچنین قادر است احساسات و لحن گوینده را به کلماتی اضافه کند که هرگز توسط فرد گفته نشده است.
این پیشرفتی قابل توجه در زمینه گفتار تولید شده توسط هوش مصنوعی است، زیرا مدلهای قبلی تنها میتوانستند صدا را تکرار کنند و در تقلید لحن و احساسات گوینده ناتوان بودند. دانشگاه کرنل در مطالعه خود از هوش مصنوعی WALL-E مایکروسافت برای ترکیب چندین صدا استفاده کرده که نمونههایی از این کار در GitHub موجود است.
نمونههای صوتی به اشتراک گذاشته شده توسط مایکروسافت، از لحاظ کیفی دارای اختلاف هستند و در حالیکه برخی از آنها کاملا طبیعی بهگوش میرسند، برخی دیگر صدایی رباتیک و ماشینی دارند. بااینحال، با ادامه پیشرفتها در حوزه هوش مصنوعی، نمونه صداهای ضبط شده بهبود خواهند یافت.
در این میان، نگرانیهای در مورد پیامدهای اخلاقی این فناوری نیز وجود دارد. با قدرتمندتر شده فناوری AI، صداهای تولید شده توسط VALL-E و نمونههای مشابه بیش از گذشته به واقعیت نزدیکتر شدهاند که ممکن است مورد سواستفاده افراد سودجو برای تماسهای اسپم قرار بگیرند. علاوه بر آن، هویت سیاستمداران و سایر شخصیتهای سرشناس نیز ممکن است توسط این ابزار تقلید صدا، جعل و در نتیجه آن، اطلاعات نادرست در رسانههای اجتماعی منتشر شوند.
فراتر از آن، نگرانیهای امنیتی نیز وجود دارند. برخی از بانکها از فناوری تشخیص صدا برای تایید هویت تماسگیرنده استفاده میکنند که در صورت پیشرفت این فناوری، امکان تشخیص واقعی یا جعلی بودن صدا بسیار سختتر خواهد شد. علاوه بر آن، این فناوری ممکن است بر حرفه صداپیشگان نیز تاثیر منفی بگذارد. زیرا اگر صداهای تولید شده توسط هوش مصنوعی به واقعیت نزدیک باشند، ممکن است دیگر به خدمات آنها نیازی نباشد.
هوش مصنوعی VALL-E مایکروسافت یک ابزار چشمگیر محسوب میشود که از پتانسیل ایجاد انقلابی بزرگ در زمینه سنتز صدا برخوردار است. بااینحال، شرکتهای توسعهدهنده لازم است مقرراتی را برای استفاده از این ابزارها ایجاد کنند تا خیال همه راحت باشد که از آنها تنها در راستای اهداف مفید استفاده خواهند شد.