هوش مصنوعی Veo 3 که در رویداد I/O گوگل معرفی شد، در حال حاضر یکی از قدرتمندترین ابزارهای تولید ویدیو با استفاده از هوش مصنوعی به شمار میرود و شاید بتوان گفت بهترین نمونه موجود در بازار است. این سامانه نه تنها قادر به تولید ویدیو بر اساس فرمانهای متنی بوده، بلکه توانایی خلق صداها و دیالوگهای واقعگرایانه با هماهنگی دقیق لبها را نیز داراست.
در ابتدا، این ابزار تنها در دسترس کاربران طرح AI Ultra با هزینه ماهانه ۲۵۰ دلار قرار داشت، اما گوگل در اواخر ماه مه، دسترسی به Veo 3 را برای مشترکان طرح AI Pro با قیمت ۲۰ دلار در ماه گسترش داد و در ادامه، این امکان را در سطح جهانی در اختیار کاربران قرار داد. گوگل با انتشار مجموعهای از تصاویر، از در دسترس قرار گرفتن گسترده Veo 3 برای تمامی کاربران سرویس Gemini خبر داد. دسترسی به این قابلیت در حال حاضر به ۱۵۹ کشور گسترش یافته است. تا پیش از این، عمده استفادهکنندگان این ابزار را علاقهمندان به فناوری، فعالان حوزه خلاقیت و یا کاربرانی تشکیل میدادند که به واسطه خرید تلفن هوشمند جدید، به شکل رایگان به طرح AI Pro دست یافته بودند.
گوگل در یک یادداشت وبلاگی اعلام کرد: «میزان خلاقیت تولیدشده توسط کاربران واقعاً شگفتانگیز بوده است؛ طی هفت هفته گذشته، بیش از ۴۰ میلیون ویدیو از طریق اپلیکیشنهای Gemini و Flow با استفاده از Veo 3 ساخته شدهاند.» اکنون این شرکت دلیلی قانعکنندهتر برای ترغیب کاربران به اشتراکگذاری و تجربه این ابزار فراهم کرده و آن، قابلیت تبدیل تصویر به ویدیو است.
این قابلیت درست یک هفته پس از آن معرفی شد که جاش وودوارد، معاون اجرایی گوگل، به آمادگی قریبالوقوع این ویژگی اشاره کرده بود. قابلیت جدید در همان تب Video که کاربران با آن در محیط Gemini آشنا هستند، قرار خواهد گرفت. افراد میتوانند تصویری را بارگذاری کرده و با توضیحاتی درباره صحنه موردنظر، از جمله دستورالعملهای صوتی در صورت لزوم، فرایند ساخت را آغاز کنند. خروجی، یک فایل MP4 با مدت زمان ۸ ثانیه، نسبت تصویر ۱۶:۹ و وضوح 720p خواهد بود.
کاربران میتوانند خلاقیت خود را از طریق جانبخشیدن به اشیای روزمره، متحرکسازی نقاشیها و طراحیها یا افزودن حرکت به مناظر طبیعی به کار بگیرند. پس از پایان فرایند تولید، امکان بهاشتراکگذاری یا دانلود ویدیو برای نمایش آن به دوستان و اعضای خانواده فراهم است. اگرچه بهطور رسمی اعلام نشده، اما به احتمال فراوان، کاربران طرح AI Pro در روز تنها میتوانند سه بار از قابلیت تبدیل تصویر به ویدیو استفاده کنند. مشترکان AI Ultra از سقف استفاده روزانه بیشتری برخوردار خواهند بود. این قابلیت همچنین به ابزار تولید فیلم Flow نیز افزوده خواهد شد.
با وجود تواناییهای تحسینبرانگیز Veo 3، نگرانیهایی نیز مطرح شده است. گزارشی از Media Matters نشان داده که این ابزار برای تولید محتوای نژادپرستانه و گمراهکننده مورد استفاده قرار گرفته و اینگونه ویدیوها در پلتفرمهایی نظیر TikTok و Instagram به سرعت در حال گسترش هستند. اگرچه گوگل مستقیماً به این مسئله واکنش نشان نداده، اما عنوان کرده که «اقدامات مهمی در پشت صحنه در حال انجام است تا اطمینان حاصل شود تجربه تولید ویدیو در چارچوب مناسب باقی بماند.» گفته شده که این ابزار طوری تنظیم شده تا از تولید محتوای «مسئلهدار» مانند خشونت، اطلاعات نادرست مضر، صحنههای غیراخلاقی و موارد مشابه جلوگیری شود.
احتمال میرود همین اقدامات محدودکننده به طور کامل در قابلیت تبدیل تصویر به ویدیو نیز اعمال شوند. همچنین، نشانهگذاریهای مشهود و پنهان برای کمک به شناسایی محتوای تولیدشده با هوش مصنوعی در نظر گرفته شده است. قابلیت تبدیل عکس به ویدیو اکنون در نسخه وب Gemini فعال شده و انتظار میرود در طول هفته جاری، به تدریج برای نسخه موبایل نیز عرضه شود.
دیدگاه ها