جمینای اکنون می‌تواند تصاویر شما را با Veo 3 به ویدیو تبدیل کند

هوش مصنوعی Veo 3 که در رویداد I/O گوگل معرفی شد، در حال حاضر یکی از قدرتمندترین ابزارهای تولید ویدیو با استفاده از هوش مصنوعی به شمار می‌رود و شاید بتوان گفت بهترین نمونه موجود در بازار است. این سامانه نه تنها قادر به تولید ویدیو بر اساس فرمان‌های متنی بوده، بلکه توانایی خلق صداها و دیالوگ‌های واقع‌گرایانه با هماهنگی دقیق لب‌ها را نیز داراست.

در ابتدا، این ابزار تنها در دسترس کاربران طرح AI Ultra با هزینه ماهانه ۲۵۰ دلار قرار داشت، اما گوگل در اواخر ماه مه، دسترسی به Veo 3 را برای مشترکان طرح AI Pro با قیمت ۲۰ دلار در ماه گسترش داد و در ادامه، این امکان را در سطح جهانی در اختیار کاربران قرار داد. گوگل با انتشار مجموعه‌ای از تصاویر، از در دسترس قرار گرفتن گسترده Veo 3 برای تمامی کاربران سرویس Gemini خبر داد. دسترسی به این قابلیت در حال حاضر به ۱۵۹ کشور گسترش یافته است. تا پیش از این، عمده استفاده‌کنندگان این ابزار را علاقه‌مندان به فناوری، فعالان حوزه خلاقیت و یا کاربرانی تشکیل می‌دادند که به واسطه خرید تلفن هوشمند جدید، به شکل رایگان به طرح AI Pro دست یافته بودند.

گوگل در یک یادداشت وبلاگی اعلام کرد: «میزان خلاقیت تولیدشده توسط کاربران واقعاً شگفت‌انگیز بوده است؛ طی هفت هفته گذشته، بیش از ۴۰ میلیون ویدیو از طریق اپلیکیشن‌های Gemini و Flow با استفاده از Veo 3 ساخته شده‌اند.» اکنون این شرکت دلیلی قانع‌کننده‌تر برای ترغیب کاربران به اشتراک‌گذاری و تجربه این ابزار فراهم کرده و آن، قابلیت تبدیل تصویر به ویدیو است.

این قابلیت درست یک هفته پس از آن معرفی شد که جاش وودوارد، معاون اجرایی گوگل، به آمادگی قریب‌الوقوع این ویژگی اشاره کرده بود. قابلیت جدید در همان تب Video که کاربران با آن در محیط Gemini آشنا هستند، قرار خواهد گرفت. افراد می‌توانند تصویری را بارگذاری کرده و با توضیحاتی درباره صحنه موردنظر، از جمله دستورالعمل‌های صوتی در صورت لزوم، فرایند ساخت را آغاز کنند. خروجی، یک فایل MP4 با مدت زمان ۸ ثانیه، نسبت تصویر ۱۶:۹ و وضوح 720p خواهد بود.

کاربران می‌توانند خلاقیت خود را از طریق جان‌بخشیدن به اشیای روزمره، متحرک‌سازی نقاشی‌ها و طراحی‌ها یا افزودن حرکت به مناظر طبیعی به کار بگیرند. پس از پایان فرایند تولید، امکان به‌اشتراک‌گذاری یا دانلود ویدیو برای نمایش آن به دوستان و اعضای خانواده فراهم است. اگرچه به‌طور رسمی اعلام نشده، اما به احتمال فراوان، کاربران طرح AI Pro در روز تنها می‌توانند سه بار از قابلیت تبدیل تصویر به ویدیو استفاده کنند. مشترکان AI Ultra از سقف استفاده روزانه بیشتری برخوردار خواهند بود. این قابلیت همچنین به ابزار تولید فیلم Flow نیز افزوده خواهد شد.

با وجود توانایی‌های تحسین‌برانگیز Veo 3، نگرانی‌هایی نیز مطرح شده است. گزارشی از Media Matters نشان داده که این ابزار برای تولید محتوای نژادپرستانه و گمراه‌کننده مورد استفاده قرار گرفته و اینگونه ویدیوها در پلتفرم‌هایی نظیر TikTok و Instagram به سرعت در حال گسترش هستند. اگرچه گوگل مستقیماً به این مسئله واکنش نشان نداده، اما عنوان کرده که «اقدامات مهمی در پشت صحنه در حال انجام است تا اطمینان حاصل شود تجربه تولید ویدیو در چارچوب مناسب باقی بماند.» گفته شده که این ابزار طوری تنظیم شده تا از تولید محتوای «مسئله‌دار» مانند خشونت، اطلاعات نادرست مضر، صحنه‌های غیراخلاقی و موارد مشابه جلوگیری شود.

احتمال می‌رود همین اقدامات محدودکننده به طور کامل در قابلیت تبدیل تصویر به ویدیو نیز اعمال شوند. همچنین، نشانه‌گذاری‌های مشهود و پنهان برای کمک به شناسایی محتوای تولیدشده با هوش مصنوعی در نظر گرفته شده است. قابلیت تبدیل عکس به ویدیو اکنون در نسخه وب Gemini فعال شده و انتظار می‌رود در طول هفته جاری، به تدریج برای نسخه موبایل نیز عرضه شود.