کمپانی OpenAI در ساخت ویدیو تبلیغاتی اخیرش چندان صادق نبوده. حالا توانایی هوش مصنوعی Sora به شدت زیر سوال رفته است.
مصاحبه تازهای با کارگردان ویدیوی هوش مصنوعی Sora جزئیات روشنگرانهای از ماهیت این ابزار جدید افشا کرده است. کلیپ تبلیغاتی سورا موسوم به Air Head با تکیه بر تواناییهای هوش مصنوعی در عصر نوین تکنولوژی منتشر شده بود. حالا مشخص شد که هوش مصنوعی در واقع نقش اندکی در تولید ویدیوی تبلیغاتی Sora ایفا کرده. با گجت نیوز همراه باشید تا جزئیات بیشتری درباره این ماجرا در اختیارتان بگذاریم.
پاتریک سدربرگ (مسئول پستولید ویدیو) در خلال مصاحبهای با FxGuide افشا کرد که برنامه تبدیل متن به ویدیو OpenAI تنها نیروی مولد در تولید این ویدیوی تبلیغاتی نبوده است! این ویدیو 1 دقیقه و 21 ثانیهای به کمک تکنیکهای متعدد فیلمسازی شامل روشهای سنتی و ویرایشهای پس از تولید ساخته شده تا نمای نهایی را پیدا کند. پیش از این هم ویدیوی تبلیغاتی بلند دیگری از هوش مصنوعی Sora منتشر شده بود که توجه کاربران زیادی را به خود جلب کرد. سپس OpenAI این ویدیو تازه را از مردی منتشر کرد که با سر بادکنکی قدم میزد.
در این ویدیو تبلیغاتی، Shykids همچنین از صدای جایگزین انسانی برای شخصیت سر بادکنکی استفاده کرد. همچنین OpenAI ویدیوی Air Head را از همه پلتفرمهای شبکههای اجتماعی خود و مخصوصا یوتیوب منتشر کرد. به اشتراک گذاری ویدیو باعث شد بینندگان چنین برداشتی داشته باشند که ویدیو حاصل تولید خلاقانه هوش مصنوعی بوده؛ در حالی که صحت ندارد.
در ویدیوی «پشت صحنه» افشا شد که Shykids بخش عمده کار را بر عهده داشته و ضمن دریافت خروجی خام از هوش مصنوعی Sora، آن را با ویرایش و اصلاح به نسخه نهایی تبدیل کرده است. روند ویرایش شامل روتوسکوپی انیمیشن برای پس زمینه، حذف چهرههایی که روی بادکنک ظاهر میشدند و تصحیح رنگی کل سوژهها میشد.
سپس به این حقیقت میرسیم که زمان زیادی لازم است تا هوش مصنوعی Sora به نظم دهی کامل نیروی مولدش برسد. سدربرگ در این باره توضیح داد که صدها قطعه فیلم 10 تا 20 ثانیهای وجود داشت که تیمش با دقت بالایی مشغول ویرایش و اصلاح آنها شدند. تیم ادیت حرفهای از این روند تحت عنوان نسبت 1 به 300 از آنچه تولید شده بود، یاد میکند.
این کار حرفهای و کاملا دستی شامل برداشتن سر از بدن مرد سوژه فیلم و تغییر آن از قرمز به زرد هم میشد. در حالی که هوش مصنوعی Sora تصاویر اولیه را تولید کرد، قطعا اقدامات بسیار زیادی پشت صحنه و پس از تولید رخ داد. همین اقدامات اصلاحی و دستی انسانی بود که باعث شد نمای ویدیوی تبلیغاتی سورا به شکل نهایی و بی نقص خود درآید. با این حساب، هنوز راه طولانی در پیش داریم تا به نقطهای برسیم که هوش مصنوعی در یک لحظه بتواند ویدیو با کیفیتی را تولید کند.
هوش مصنوعی Sora همچنین غیر رسمی باقی میماند تا OpenAI روند اجرای آزمایشی پروژههای توسعه را مانند ویدیوی Air Head به اتمام برساند. به عبارتی هرکدام از این ویدیوهای تبلیغاتی که منتشر میشوند، یک گام پیش به جلو در مسیر توسعه ابزار اصلی به شمار میروند. کلیپ Air Head حالا بیش از صدها هزار بازدید در شبکههای اجتماعی داشته و OpenAI مشخصا برچسب «آزمایشی» روی آن گذاشته است.
هوش مصنوعی Sora، تاثیرگذار اما غیر مطمئن
شاید OpenAI تلاش زیادی کرده تا عملکرد نهایی خدماتش از طریق مدل بزرگ زبانی را به نمایش بگذارد؛ اما نبود شفافیت در انتشار محصول همچنان نگران کننده است.
تیم تولید کننده هم توانسته است محصول Air Head را به شکل فوق العادهای تاثیرگذار تولید کند. هرچند نباید فراموش کنیم که این کلیپ کوتاه حاصل ویرایش سنگین یک تیم حرفهای است!
پیش از این هوش مصنوعی Sora را تحت عنوان ابزاری سریع برای تولید ویدیو تنها با یک کلیک معرفی میکردند. حالا مشخص شده که سورا حداقل در وضعیت فعلیاش، نشانگر ابزاری برای بهبود تصاویر است نه تولید از صفر! این خدمات هوش مصنوعی قبلا هم وجود داشته و سازندگان میتوانستند در روند تولید به عنوان نیروی کمکی از آن بهره بگیرند. با توجه به این جزئیات جدید، هوش مصنوعی Sora چندان انقلابی به نظر نمیرسد.