یک فرآیند هوش مصنوعی (AI) به تازگی توسط دانشمندان دانشگاه دوک معرفی شده که میتواند تصویری تار شامل چندین پیکسل را رمزگشایی کرده و عکسی واضح را به ما تحویل دهد.
فرآیند هوش مصنوعی (AI) معرفی شده از دانشگاه دوک که اخیرا توجهها را به خود جلب کرده، توانایی تبدیل تصاویر محو و چند پیکسلی را به عکسهایی دقیق شامل جزئیاتی حیرتانگیز دارد. در ادامه با گجت نیوز همراه باشید تا این پیشرفت نسبتا ترسناک در حوزه AI را بررسی کنیم.
فرآیند هوش مصنوعی برای پردازش تصاویر
آنچه در تصویر بالا میبینیم تصویر ورودی و محصول نهایی بوده که به یکی از تازهترین فناوریهای هوش مصنوعی مربوط میشوند. عکس سمت چپ یک تصویر محو و چند پیکسلی بوده که با ورود به بخش پردازش این فناوری به تصویر سمت راست تبدیل شده و جزئیاتی که میبینیم تماما توسط AI به کار رفته، اضافه شدهاند.
جزئیاتی مانند خطوط صورت، چین و چروک دور چشمها و ابعاد قسمتهای مختلف چهره فرد داخل تصویر همگی توسط این فرآیند هوش مصنوعی تولید شدهاند و در تصویر ابتدایی هیچ کدام از این جزئیات وجود نداشتند. البته نکتهای که از نگرانی در مورد این پیشرفت تازه فناوری AI کم میکند، غیرواقعی بودن تصویر تولیدی است. به بیان دیگر فرآیند مورد نظر روشی عجیب و خطرناک برای از بین بردن قسمت تار در تصاویر نیست و صورتهایی که توسط این شبکه هوش مصنوعی تولید میشوند، واقعی نبوده و خیالی هستند.
با این وجود جالب است بدانیم که فناوری اخیر تقریبا 8 برابر نسبت به نمونههای پیشین این تکنیک تولید تصاویر پیشرفت داشته و میتواند تا 64 مرتبه کیفیت عکس ورودی را افزایش دهد.
جزئیات دستاورد اخیر
دانشمندان این فرآیند هوش مصنوعی را پالس (PULSE) نامگذاری کردهاند و همانطور که سینتیا رودین (Cynthia Rudin)، استاد علوم کامپیوتری از دانشگاه دوک گفته، به هیچ وجه سابقه نداشته که یک شبکه AI بتواند این سطح از جزئیات را از تصویری کاملا کلی و چند پیکسلی به وجود آورد.
برعکس آنچه تصور میشود، هوش مصنوعی پالس در طی فرآیندی معکوس صورتها و تصاویر دقیقی را تولید میکند که در صورت تار شدن و کاهش تعداد پیکسلها، به عکس اولیه چند پیکسلی شبیه میشوند. در واقع یک سطح 16 در 16 از پیکسلها میتواند با پردازش در شبکه اخیر به تصویری با تعداد پیکسل 1024 در 1024 تبدیل شده و در کوتاهترین زمان ممکن، بیش از یک میلیون پیکسل به آن اضافه شود.
اما فرآیند هوش مصنوعی مورد استفاده توسط تیم رودین در نوع خود شگفتانگیز است؛ این فناوری سیستمی به نام شبکه مولد متقابل (GAN) را برای تولید تصاویر باکیفیت به کار میبرد. سیستم GAN دو شبکه عصبی یا همان موتورهای یادگیری هوش مصنوعی که از عملکرد مغز انسان تقلید میکنند را در مقابل هم قرار داده و با تمرین دادن این شبکهها روی یک نمونه واحد از تصاویر پیکسلی، به نتیجه دلخواه میرسد. از این طریق، یکی از شبکهها تصاویر خیالی مورد نیاز را تولید کرده و شبکه عصبی دیگر به صورت همزمان تشخیص میدهد که کدام یک از تصاویر تولیدی با عکس چند پیکسلی اولیه مطابقت دارند.
کاربردها
با به کار گیری سیستم شبکه مولد متقابل، دانشمندان برخلاف تکنیکهای پیشین عکسهایی را تولید میکنند که هیچ قسمت محو و تاری ندارند. از طرف دیگر موفقیت اصلی این فرآیند هوش مصنوعی به جستجوی آن برای مشخص کردن تعداد زیادی کاندید برای تصویر چند پیکسلی اولیه مربوط میشود؛ در حالی که اگر قرار بود شبکههای عصبی به کار رفته تنها به دنبال یک تصویر مشخص و کاملا مطابق با ویژگیهای مورد نیاز میگشتند، چنین موفقیتی حاصل نمیشد.
بر اساس تازهترین اطلاعات، سیستمهای GAN روز به روز پیشرفتهتر میشوند و مدتی پیش هم کمپانی عظیم انویدیا (Nvidia) با بهرهگیری از همین شبکه توانسته بود تصاویر عجیب و شگفتانگیزی از انسانهایی را تولید کند که هرگز وجود خارجی نداشتهاند. سیستم مورد استفاده انویدیا با ترکیب عکس انسانهای واقعی، افرادی را به وجود میآورد که واقعا وجود ندارند؛ سیستم هوش مصنوعی پالس هم با تکنیکی مشابه، عکسهای محو و چند پیکسلی را به عنوان منبع به کار برده و تصاویری مطابق خواست اولیه را ارائه میکند.
البته این تصاویر تنها به صورت انسانها محدود نمیشوند و توسعه دهندگان پالس میگویند که فرآیند هوش مصنوعی آنها میتواند تصاویر چند پیکسلی مربوط به هر سوژهای را پردازش کند. چنین کاربردی میتواند تکنولوژی مورد نظر را برای استفاده در حوزههای مختلفی از جمله ستاره شناسی، پزشکی، پردازش تصاویر ماهوارهای و حوزههای مشابه آماده کند.
تحقیقات تیم دانشگاه دوک در کنفرانس 2020 CVPR ارائه شده مقاله مربوط به این دستاورد به زودی منتشر خواهد شد.