اگر اخبار فناوری را دنبال کرده باشید، احتمالاً نام Veo 3 جدید گوگل را شنیدهاید. این مدل پیشرفته، در کنفرانس سالانه گوگل در همین ماه معرفی شد و پیشرفتهترین مدل تولید ویدیو توسط این شرکت تا به امروز محسوب میشود.
با استفاده از Veo 3، کاربران میتوانند تنها با نوشتن یک متن ساده، ویدیوهایی واقعی و نزدیک به انسان بسازند که شامل دیالوگ، صداهای پسزمینه و حتی موسیقی متن است.
اما در کنار شگفتیهایی که Veo 3 به همراه داشت، پرسشهایی اساسی درباره آینده صنعت ویدیو، سینما و حتی اخبار را نیز برانگیخت.
در این مقاله از مجله اینترنتی اسید هولیک، هر آنچه که باید درباره Veo 3 بدانید را بررسی میکنیم: از نحوه عملکرد آن گرفته تا کاربردهایش و دلایلی که باعث شده بحثهای گستردهتری پیرامون آن شکل بگیرد.
یک نسل جدید از ویدیوی هوش مصنوعی
در حالی که ویدیوهای تولیدشده با کامپیوتر چیز جدیدی نیستند، اما Veo 3 خود را با قابلیت تولید همزمان تصویر و صدا متمایز میکند. یعنی میتوانید یک صحنه را توصیف کنید و Veo 3 آن را بهصورت ویدیویی با دیالوگ، افکتهای صوتی و موسیقی متناسب تولید میکند.
این یعنی نیازی به ترکیب دستی تصویر و صدا نیست؛ بلکه سیستم به طور یکپارچه هر دو را خلق میکند.
و نتایج واقعاً چشمگیرند. بسیاری از کاربران گفتهاند که ویدیوهای تولیدی آنقدر واقعی هستند که تشخیص واقعی بودن یا ساختهشده بودنشان سخت است.
چه چیزی Veo 3 را خاص میکند؟
درست است که تولید ویدیو با هوش مصنوعی چیز تازهای نیست و شرکتهایی مانند OpenAI و Runway نیز نرمافزارهای مشابهی عرضه کردهاند، اما Veo 3 به دلایل زیر برجستهتر است:
- توانایی تولید همزمان صدا و تصویر تنها با یک پیام متنی؛
- تولید ویدیوهایی که قوانین فیزیک را رعایت میکنند و حرکات طبیعیتر و واقعیتری دارند؛
- خروجیهایی با کیفیت بالا که هم برای استفاده حرفهای و هم شخصی مناسباند؛
- قابلیت تغییر زاویه دوربین، ساخت صحنههای جدید و حفظ انسجام کاراکترها در ویدیوهای مختلف.
فیلمسازی با هوش مصنوعی از طریق Flow
در تاریخ ۲۰ مه امسال، گوگل از ابزار جدید خود به نام Flow رونمایی کرد. این ابزار برای کمک به خلاقان در مسیر “نسل جدید داستانسرایی” طراحی شده است.
از طریق Flow، کاربران میتوانند با وارد کردن پیام متنی، صحنهها را طراحی کنند و محتوای تولیدشده توسط Veo 3 را ویرایش نمایند – همه در یک محیط واحد.
یکی از بهترین ویژگیهای Flow، سادگی در استفاده است: فقط کافی است توصیف کنید چه چیزی میخواهید و Flow – که از Veo 3 قدرت میگیرد – آن را برایتان میسازد.
به همین سادگی!
با استفاده از Flow میتوان زاویه دید را تنظیم کرد، آواتارها را ذخیره نمود، کلیپها را ویرایش کرد و داستانهای کامل ساخت.
بخشی از مجموعه محصولات هوش مصنوعی گوگل
گرچه Veo 3 یکی از هیجانانگیزترین دستاوردهای گوگل است، اما به تنهایی عرضه نشده و با سایر ابزارهای هوش مصنوعی گوگل یکپارچه کار میکند:
- Gemini – مدل پردازش زبان طبیعی گوگل که کمک میکند Veo 3 متون را بفهمد و به ویدیو تبدیل کند؛
- Imagen 4 – ابزار تولید تصویر که منابع بصری لازم برای صحنههای Veo 3 را فراهم میکند؛
- Flow – پلتفرم تولید ویدیوی گوگل برای ساخت روایتهای کامل با استفاده از Veo 3.
هزینه استفاده از Veo 3 چقدر است؟
طبیعتاً گوگل Veo 3 را رایگان عرضه نکرده است. در حال حاضر، این ابزار تنها از طریق Google AI Ultra (با هزینه ۲۴۹ دلار در ماه) و Vertex AI در آمریکا در دسترس است.
همچنین میتوان از طریق اعتبارهای Flow بابت هر درخواست استفاده کرد – هر پیام متنی بخشی از این اعتبارها را مصرف میکند.
چرا Veo 3 تا این حد خبرساز شده؟
در دنیایی که هر روز ابزار جدیدی در زمینه هوش مصنوعی معرفی میشود، چه چیز Veo 3 را خاص میکند؟
پاسخ ساده است: Veo 3 میتواند نحوه تولید و روایت داستانها را کاملاً متحول کند. این فناوری ساخت ویدیو را حتی برای کسانی که هیچ مهارت فنی ندارند ممکن میسازد.
با Veo 3، دیگر نیازی به بازیگر، دوربین، صحنه یا بودجه نیست – تنها یک پیام متنی خوب کافی است.
اما این تحول چه صنایعی را تحت تأثیر قرار میدهد؟ فقط چند مورد را در نظر بگیرید:
- فیلمسازی کمهزینه یا مستقل؛
- تولید محتوای تبلیغاتی و بازاریابی؛
- گزارشهای خبری و تحلیلهای روز؛
- آموزش و ارائه تصویری مفاهیم در کلاسهای درس؛
- و بسیاری حوزههای دیگر.
چالشها و نگرانیهای Veo 3 چیست؟
مثل هر فناوری هوش مصنوعی دیگر، Veo 3 هم مسائل اخلاقی مهمی را به همراه دارد.
مثلاً:
- مالکیت ویدیوهای ساختهشده با هوش مصنوعی متعلق به چه کسی است؟
- وضعیت حقوقی کپیرایت در چنین محتوایی چگونه تعریف میشود؟
- اگر کاراکتری بیش از حد شبیه یک فرد واقعی باشد، آیا آن فرد حقی بر تصویرش دارد؟
- چطور میتوان از Veo 3 برای ساخت دیپفیکهای خطرناک و اخبار جعلی جلوگیری کرد؟
- و مهمتر از همه: آیا این ابزار جای فیلمسازان انسانی را خواهد گرفت؟
اگر هر کسی بتواند با یک پیام متنی ویدیویی حرفهای بسازد، آیا سینما از مسیر خلاقیت به مسیر “دستور دادن به هوش مصنوعی” سوق داده میشود؟
با گسترش این نوع فناوری، باید دید قوانین و شیوههای اعتباردهی چطور توسعه مییابند و خود را با واقعیتهای جدید هماهنگ میکنند.
Veo 3؛ نقطه عطفی در دنیای فیلمسازی
عرضه Veo 3 قدمی بزرگ در مسیر تولید ویدیو با هوش مصنوعی است – اما این تازه آغاز راه است.
این فناوری کمک میکند افراد بیشتری داستان بگویند، دنیاهای جدید بسازند و خلاقیتشان را به تصویر بکشند.
اما این پیشرفت، خالی از چالش نیست. با فراگیرتر شدن Veo 3، باید دید صنعت فیلمسازی چگونه خود را با ورود این حجم از شخصیتها، ایدهها و فرصتهای تازه تطبیق خواهد داد.