در حال حاضر خیلی راحت میتوانیم صحبت کردن یک انسان واقعی را از صحبت کردن یک ربات که تنها متنهای از پیش تعیین شده را با لحنی مصنوعی تکرار میکند، تشخیص دهیم. اما این موضوع در حال تغییر است و شاید در یکی دو سال آینده شما ندانید که در حال مکالمهی تلفنی با یک مسئول روابط عمومی هستید و یا با یک ربات فوق هوشمند!
تیم DeepMind گوگل که بر روی هوش مصنوعی و توسعهی رشتههای عصبی الکترونیکی فعالیت میکند، به تازگی از قابلیتهای سیستم هوش مصنوعی WaveNet پرده برداشته است. این هوش مصنوعی قادر است که مشابه یک انسان و با لحنی کاملا طبیعی با شما صحبت کند و سخنرانیهای کوتاه انجام دهد؛ تیم DeepMind چندی پیش سیستم هوشمندی به نام AlphaGo را توسعه داده بودند که توانست یکی از بازیکنان افسانهای بازی تختهای Go را شکست دهد و درجهی استادی این بازی را از کشور کرهی جنوبی دریافت کند!
در حال حاضر توسعه دهندگان از دو روش برای توسعه و ساخت نرم افزارهای گفتاری و سخنگو استفاده میکنند. اولین روش این است که مجموعهی بسیار بزرگی از کلمات و جملاتی که توسط یک انسان تلفظ شده است، در اختیار آن نرم افزار قرار بگیرد. این روش باعث میشود که قابلیت تغییر و دستکاری لحن جملات به هیچ وجه وجود نداشته باشد و یا این کار خیلی سخت باشد.
روش دوم این است که ربات بر مبنای آنالیز خود، کلمات را بسازد و تلفظ کند و آنها را بر مبنای این که هر حرف چه تلفظی دارد، برای کاربر تکرار کند. این روش امکان تغییرپذیری بسیار بیشتری دارد، اما مطمئنا نتیجهی کار کاملا مصنوعی خواهد شد و از فرسنگها دورتر مشخص است که یک ربات دارد این کلمات را ادا میکند.
حالا برای این که هوش مصنوعی WaveNet بتواند مانند یک انسان و با لحنی طبیعی صحبت کند، محققان گوگل مجموعهای از امواج صوتی را در اختیار آن گذاشته اند. این امواج صوتی در واقع همان اشکالی هستند که در برخی از پلیرهای موسیقی دیدهاید و با تغییر بخشهای مختلف صدا، بالا و پایین میشوند و رنگ آنها تغییر میکند و البته تمام آنها نیز توسط سخنرانان واقعی ادا شدهاند.
حالا WaveNet قادر است که با تشکیل این امواج صوتی، کلمات را بسازد و آنها را تلفظی بسیار دقیق و مشابه لحن انسانی، ادا کند. گفتنی است که تستهایی بر مبنای زبان انگلیسی و زبان چینی بر روی این سیستم هوش مصنوعی انجام شده است و اکثر شنوندگان معتقد بودهاند که WaveNet قادر است بسیار طبیعیتر از دیگر نرم افزارهای صوتی، صحبت کند و کلمات مختلف را ادا کند. گفتنی است که احتمالا فاصلهی بسیار زیادی از عرضهی یک اپلیکیشن قدرت گرفته از این سیستم هوشمند داشته باشیم، اما با مراجعه به این لینک در سایت رسمی تیم DeepMind گوگل میتوانید نمونههایی از اصوات تلفظ شده توسط هوش مصنوعی WaveNet را بشنوید.