رونمایی گوگل از Veo و Imagen 3: ابزارهای جدید هوش مصنوعی برای خلق تصاویر و ویدیو

0 ارسال شده توسط: معین کریمی 26 اردیبهشت 1403 ساعت 00:08

گوگل از هوش مصنوعی Veo و Imagen 3 پرده‌برداری کرد. این دو ابزارهای جدید هوش مصنوعی برای خلق عکس و ویدیو واقع‌گرایانه و خلاقانه هستند.

در رویداد I/O گوگل، هوش مصنوعی حرف اول را می‌زند! امروز گوگل از موتورهای جدید خلق محتوای هوش مصنوعی خود رونمایی کرد: یکی از آن‌ها Veo است که می‌تواند ویدیوهای 1080p با کیفیت بالا تولید کند و دومی Imagen 3 است که جدیدترین فریمورک تبدیل متن به تصویر گوگل خواهد بود.

هیچ کدام از این دو به طور خاص انقلابی به نظر نمی‌رسند، اما راهی برای گوگل است تا در رقابت با هوش مصنوعی ویدیویی Sora شرکت OpenAI و Dall-E 3 که عملاً مترادف با تصاویر تولید شده توسط هوش مصنوعی شده است، عقب نماند.

هوش مصنوعی Veo گوگل

گوگل ادعا می‌کند Veo با «درک پیشرفته‌ای از زبان طبیعی و معانی تصویری» می‌تواند هر ویدیویی را که در نظر دارید بسازد. ویدیوهای تولید شده توسط هوش مصنوعی می‌توانند «بیش از یک دقیقه» طول داشته باشند. هوش مصنوعی گوگل Veo همچنین قادر به درک تکنیک‌های سینمایی و بصری، مانند مفهوم تایم‌لپس است. اما واقعا، این قابلیت‌ها باید استانداردهای اولیه برای یک مدل تولید ویدیوی هوش مصنوعی باشد، درست است؟

گوگل همچنین برای کمک به حفظ مالکیت معنوی آثار هنری، با دونالد گلاور و استودیوی خلاقانه او یعنی گلگا همکاری کرده است. به گفته گوگل، Veo می‌تواند فیزیک دنیای واقعی را نسبت به مدل‌های قبلی خود بهتر شبیه‌سازی کند و همچنین نحوه رندر کردن تصاویر با کیفیت بالا را بهبود ببخشد.

به گفته دونالد گلاور، هنرمند و بازیگر مشهور، Veo پتانسیل دموکراتیک کردن فرآیند فیلمسازی و داستان‌سرایی را دارد: «همه قرار است کارگردان شوند و همه باید بتوانند کارگردان باشند. قلب همه این چیزها داستان‌سرایی است. هر چقدر به هم نزدیک‌تر باشیم تا داستان‌های خودمان را تعریف کنیم، همدیگر را بیشتر درک می‌کنیم».

هنوز مشخص نیست که آیا مخاطبان علاقه‌ای به دیدن ویدیوهای ساخته شده توسط هوش مصنوعی داشته باشند یا خیر. مگر آنکه مشتاق برای دیدن تلاش یک الگوریتم هوش مصنوعی برای بازسازی آثار هنری انسان‌ها باشند. با این حال هم گوگل و هم OpenAI همچنان به تبلیغ این ابزارها ادامه می‌دهند و امیدوارند که مفید (یا حداقل پرسود) واقع شوند.

گوگل اعلام کرده است که Veo از امروز برای برخی از تولیدکنندگان محتوا در ابزار VideoFX در دسترس خواهد بود و قرار است در آینده به یوتیوب شورتس و سایر محصولات هم اضافه شود. اگر Veo به یک قابلیت داخلی در یوتیوب شورتس تبدیل شود، می‌تواند یک مزیت رقابتی برای گوگل در برابر تیک‌تاک به شمار رود.

هوش مصنوعی Imagen 3 گوگل

در مورد هوش مصنوعی Imagen 3 هم گوگل همان وعده‌های همیشگی را می‌دهد. گفته می‌شود این مدل مبتنی بر تبدیل متن به تصویر با بالاترین کیفیت در بین مدل‌های گوگل است و می‌تواند با سطح باورنکردنی از جزئیات، تصاویر فوق‌واقع‌گرایانه و شبیه به زندگی و با مصنوعات کمتر تولید کند.

البته آزمون واقعی این است که عملکرد آن در پردازش عبارات ورودی در مقایسه با Dall-E 3 چگونه خواهد بود. گوگل ادعا می‌کند که Imagen 3 نسبت به گذشته، متن را بهتر درک می‌کند و همچنین در مدیریت جزئیات از عبارات طولانی هوشمندانه‌تر عمل می‌کند.

هوش مصنوعی هر روز باهوش‌تر می‌شود. آیا هر کدام از این موارد واقعاً زندگی ما را بهتر خواهد کرد؟ آیا آن‌ها هرگز قادر خواهند بود تا هنر واقعی و با روحی را خلق کنند؟ تا زمانی که هوش عمومی مصنوعی (AGI) به طور واقعی ظاهر شود یا تمدن ما فرو بریزد، هر سال در رویداد I/O گوگل این سوالات را مطرح خواهیم کرد.

در گجت نیوز بخوانید:

هوش مصنوعی Gemini گوگل در سیستم عامل اندروید ادغام شد گوگل با هوش مصنوعی، موتور جستجوی خود را متحول می‌کند شاهکار جدید گوگل: جستجو با ویدیو