گوگل از هوش مصنوعی Veo و Imagen 3 پردهبرداری کرد. این دو ابزارهای جدید هوش مصنوعی برای خلق عکس و ویدیو واقعگرایانه و خلاقانه هستند.
در رویداد I/O گوگل، هوش مصنوعی حرف اول را میزند! امروز گوگل از موتورهای جدید خلق محتوای هوش مصنوعی خود رونمایی کرد: یکی از آنها Veo است که میتواند ویدیوهای 1080p با کیفیت بالا تولید کند و دومی Imagen 3 است که جدیدترین فریمورک تبدیل متن به تصویر گوگل خواهد بود.
هیچ کدام از این دو به طور خاص انقلابی به نظر نمیرسند، اما راهی برای گوگل است تا در رقابت با هوش مصنوعی ویدیویی Sora شرکت OpenAI و Dall-E 3 که عملاً مترادف با تصاویر تولید شده توسط هوش مصنوعی شده است، عقب نماند.
هوش مصنوعی Veo گوگل
گوگل ادعا میکند Veo با «درک پیشرفتهای از زبان طبیعی و معانی تصویری» میتواند هر ویدیویی را که در نظر دارید بسازد. ویدیوهای تولید شده توسط هوش مصنوعی میتوانند «بیش از یک دقیقه» طول داشته باشند. هوش مصنوعی گوگل Veo همچنین قادر به درک تکنیکهای سینمایی و بصری، مانند مفهوم تایملپس است. اما واقعا، این قابلیتها باید استانداردهای اولیه برای یک مدل تولید ویدیوی هوش مصنوعی باشد، درست است؟
گوگل همچنین برای کمک به حفظ مالکیت معنوی آثار هنری، با دونالد گلاور و استودیوی خلاقانه او یعنی گلگا همکاری کرده است. به گفته گوگل، Veo میتواند فیزیک دنیای واقعی را نسبت به مدلهای قبلی خود بهتر شبیهسازی کند و همچنین نحوه رندر کردن تصاویر با کیفیت بالا را بهبود ببخشد.
به گفته دونالد گلاور، هنرمند و بازیگر مشهور، Veo پتانسیل دموکراتیک کردن فرآیند فیلمسازی و داستانسرایی را دارد: «همه قرار است کارگردان شوند و همه باید بتوانند کارگردان باشند. قلب همه این چیزها داستانسرایی است. هر چقدر به هم نزدیکتر باشیم تا داستانهای خودمان را تعریف کنیم، همدیگر را بیشتر درک میکنیم».
هنوز مشخص نیست که آیا مخاطبان علاقهای به دیدن ویدیوهای ساخته شده توسط هوش مصنوعی داشته باشند یا خیر. مگر آنکه مشتاق برای دیدن تلاش یک الگوریتم هوش مصنوعی برای بازسازی آثار هنری انسانها باشند. با این حال هم گوگل و هم OpenAI همچنان به تبلیغ این ابزارها ادامه میدهند و امیدوارند که مفید (یا حداقل پرسود) واقع شوند.
گوگل اعلام کرده است که Veo از امروز برای برخی از تولیدکنندگان محتوا در ابزار VideoFX در دسترس خواهد بود و قرار است در آینده به یوتیوب شورتس و سایر محصولات هم اضافه شود. اگر Veo به یک قابلیت داخلی در یوتیوب شورتس تبدیل شود، میتواند یک مزیت رقابتی برای گوگل در برابر تیکتاک به شمار رود.
هوش مصنوعی Imagen 3 گوگل
در مورد هوش مصنوعی Imagen 3 هم گوگل همان وعدههای همیشگی را میدهد. گفته میشود این مدل مبتنی بر تبدیل متن به تصویر با بالاترین کیفیت در بین مدلهای گوگل است و میتواند با سطح باورنکردنی از جزئیات، تصاویر فوقواقعگرایانه و شبیه به زندگی و با مصنوعات کمتر تولید کند.
البته آزمون واقعی این است که عملکرد آن در پردازش عبارات ورودی در مقایسه با Dall-E 3 چگونه خواهد بود. گوگل ادعا میکند که Imagen 3 نسبت به گذشته، متن را بهتر درک میکند و همچنین در مدیریت جزئیات از عبارات طولانی هوشمندانهتر عمل میکند.
هوش مصنوعی هر روز باهوشتر میشود. آیا هر کدام از این موارد واقعاً زندگی ما را بهتر خواهد کرد؟ آیا آنها هرگز قادر خواهند بود تا هنر واقعی و با روحی را خلق کنند؟ تا زمانی که هوش عمومی مصنوعی (AGI) به طور واقعی ظاهر شود یا تمدن ما فرو بریزد، هر سال در رویداد I/O گوگل این سوالات را مطرح خواهیم کرد.