این فرآیند ترسناک هوش مصنوعی تصاویر چند پیکسلی را رمزگشایی می‌کند!

این فرآیند ترسناک هوش مصنوعی تصاویر چند پیکسلی را رمزگشایی می‌کند!

یک فرآیند هوش مصنوعی (AI) به تازگی توسط دانشمندان دانشگاه دوک معرفی شده که می‌تواند تصویری تار شامل چندین پیکسل را رمزگشایی کرده و عکسی واضح را به ما تحویل دهد.

فرآیند هوش مصنوعی (AI) معرفی شده از دانشگاه دوک که اخیرا توجه‌ها را به خود جلب کرده، توانایی تبدیل تصاویر محو و چند پیکسلی را به عکس‌هایی دقیق شامل جزئیاتی حیرت‌انگیز دارد. در ادامه با گجت نیوز همراه باشید تا این پیشرفت نسبتا ترسناک در حوزه AI را بررسی کنیم.

فرآیند هوش مصنوعی برای پردازش تصاویر

آنچه در تصویر بالا می‌بینیم تصویر ورودی و محصول نهایی بوده که به یکی از تازه‌ترین فناوری‌های هوش مصنوعی مربوط می‌شوند. عکس سمت چپ یک تصویر محو و چند پیکسلی بوده که با ورود به بخش پردازش این فناوری به تصویر سمت راست تبدیل شده و جزئیاتی که می‌بینیم تماما توسط AI به کار رفته، اضافه شده‌اند.

جزئیاتی مانند خطوط صورت، چین و چروک دور چشم‌ها و ابعاد قسمت‌های مختلف چهره فرد داخل تصویر همگی توسط این فرآیند هوش مصنوعی تولید شده‌اند و در تصویر ابتدایی هیچ کدام از این جزئیات وجود نداشتند. البته نکته‌ای که از نگرانی در مورد این پیشرفت تازه فناوری AI کم می‌کند، غیرواقعی بودن تصویر تولیدی است. به بیان دیگر فرآیند مورد نظر روشی عجیب و خطرناک برای از بین بردن قسمت تار در تصاویر نیست و صورت‌هایی که توسط این شبکه هوش مصنوعی تولید می‌شوند، واقعی نبوده و خیالی هستند.

با این وجود جالب است بدانیم که فناوری اخیر تقریبا 8 برابر نسبت به نمونه‌های پیشین این تکنیک تولید تصاویر پیشرفت داشته و می‌تواند تا 64 مرتبه کیفیت عکس ورودی را افزایش دهد.

جزئیات دستاورد اخیر

دانشمندان این فرآیند هوش مصنوعی را پالس (PULSE) نام‌گذاری کرده‌اند و همان‌طور که سینتیا رودین (Cynthia Rudin)، استاد علوم کامپیوتری از دانشگاه دوک گفته، به هیچ وجه سابقه نداشته که یک شبکه AI بتواند این سطح از جزئیات را از تصویری کاملا کلی و چند پیکسلی به وجود آورد.

این فرآیند ترسناک هوش مصنوعی تصاویر چند پیکسلی را رمزگشایی می‌کند!

برعکس آنچه تصور می‌شود، هوش مصنوعی پالس در طی فرآیندی معکوس صورت‌ها و تصاویر دقیقی را تولید می‌کند که در صورت تار شدن و کاهش تعداد پیکسل‌ها، به عکس اولیه چند پیکسلی شبیه می‌شوند. در واقع یک سطح 16 در 16 از پیکسل‌ها می‌تواند با پردازش در شبکه اخیر به تصویری با تعداد پیکسل 1024 در 1024 تبدیل شده و در کوتاه‌ترین زمان ممکن، بیش از یک میلیون پیکسل به آن اضافه شود.

اما فرآیند هوش مصنوعی مورد استفاده توسط تیم رودین در نوع خود شگفت‌انگیز است؛ این فناوری سیستمی به نام شبکه مولد متقابل (GAN) را برای تولید تصاویر باکیفیت به کار می‌برد. سیستم GAN دو شبکه عصبی یا همان موتورهای یادگیری هوش مصنوعی که از عملکرد مغز انسان تقلید می‌کنند را در مقابل هم قرار داده و با تمرین دادن این شبکه‌ها روی یک نمونه واحد از تصاویر پیکسلی، به نتیجه دلخواه می‌رسد. از این طریق، یکی از شبکه‌ها تصاویر خیالی مورد نیاز را تولید کرده و شبکه عصبی دیگر به صورت هم‌زمان تشخیص می‌دهد که کدام یک از تصاویر تولیدی با عکس چند پیکسلی اولیه مطابقت دارند.

کاربردها

با به کار گیری سیستم شبکه مولد متقابل، دانشمندان برخلاف تکنیک‌های پیشین عکس‌هایی را تولید می‌کنند که هیچ قسمت محو و تاری ندارند. از طرف دیگر موفقیت اصلی این فرآیند هوش مصنوعی به جستجوی آن برای مشخص کردن تعداد زیادی کاندید برای تصویر چند پیکسلی اولیه مربوط می‌شود؛ در حالی که اگر قرار بود شبکه‌های عصبی به کار رفته تنها به دنبال یک تصویر مشخص و کاملا مطابق با ویژگی‌های مورد نیاز می‌گشتند، چنین موفقیتی حاصل نمی‌شد.

بر اساس تازه‌ترین اطلاعات، سیستم‌های GAN روز به روز پیشرفته‌تر می‌شوند و مدتی پیش هم کمپانی عظیم انویدیا (Nvidia) با بهره‌گیری از همین شبکه توانسته بود تصاویر عجیب و شگفت‌انگیزی از انسان‌هایی را تولید کند که هرگز وجود خارجی نداشته‌اند. سیستم مورد استفاده انویدیا با ترکیب عکس انسان‌های واقعی، افرادی را به وجود می‌آورد که واقعا وجود ندارند؛ سیستم هوش مصنوعی پالس هم با تکنیکی مشابه، عکس‌های محو و چند پیکسلی را به عنوان منبع به کار برده و تصاویری مطابق خواست اولیه را ارائه می‌کند.

البته این تصاویر تنها به صورت انسان‌ها محدود نمی‌شوند و توسعه دهندگان پالس می‌گویند که فرآیند هوش مصنوعی آن‌ها می‌تواند تصاویر چند پیکسلی مربوط به هر سوژه‌ای را پردازش کند. چنین کاربردی می‌تواند تکنولوژی مورد نظر را برای استفاده در حوزه‌های مختلفی از جمله ستاره شناسی، پزشکی، پردازش تصاویر ماهواره‌ای و حوزه‌های مشابه آماده کند.

تحقیقات تیم دانشگاه دوک در کنفرانس 2020 CVPR ارائه شده مقاله مربوط به این دستاورد به زودی منتشر خواهد شد.