آیا هوش مصنوعی Veo3 گوگل دنیای بازی‌های ویدیویی را متحول می‌کند؟

رضا باقری 15 تیر 1404 اخبار و رویداد ۴ دقیقه زمان مطالعه 0 دیدگاه ( ۰ امتیاز )

دمیس هسابیس، مدیرعامل دیپ‌مایند (بازوی تحقیقاتی هوش مصنوعی گوگل)، با یک اشاره تلویحی، گمانه‌زنی‌ها درباره استفاده از جدیدترین مدل هوش مصنوعی این شرکت، یعنی Veo 3، در ساخت بازی‌های ویدیویی را برانگیخت.

ماجرا از یک پست در شبکه اجتماعی ایکس (توییتر سابق) شروع شد. کاربری از گوگل خواسته بود: «اجازه بدهید با ویدیوهایی که Veo 3 می‌سازد، بازی کنم. مدل‌های جهانِ قابل بازی کی از راه می‌رسند؟» هسابیس در پاسخی کوتاه و معنادار نوشت: «این ایده فوق‌العاده‌ای خواهد بود.»

هرچند این پاسخ‌ها فعلاً در حد یک اشاره غیررسمی است و سخنگوی گوگل نیز اعلام کرده که این شرکت در حال حاضر اطلاعات بیشتری برای به اشتراک گذاشتن ندارد، اما ایده ساخت دنیاهای قابل بازی با هوش مصنوعی برای غول فناوری مانند گوگل، دور از ذهن نیست.

تفاوت «مدل جهانی» با «مدل تولید ویدیو» چیست؟

آیا هوش مصنوعی Veo3 گوگل دنیای بازی‌های ویدیویی را متحول می‌کند؟

باید توجه داشت که «مدل‌های جهانی» (World Models) با مدل‌های تولید ویدیو تفاوت دارند. یک مدل تولید ویدیو، مانند Veo 3، تنها ویدیوهای واقع‌گرایانه می‌سازد. اما یک «مدل جهانی»، محیطی مجازی را شبیه‌سازی می‌کند و به هوش مصنوعی اجازه می‌دهد تا پیش‌بینی کند در پاسخ به اقدامات کاربر، دنیای اطراف چگونه تغییر خواهد کرد. به زبان ساده، اولی یک فیلم‌ساز است و دومی یک شبیه‌ساز تعاملی.

جاه‌طلبی‌های گوگل در ساخت دنیاهای مجازی

گوگل پیش از این نیز جاه‌طلبی‌های خود را در این زمینه نشان داده است. این شرکت قصد دارد مدل هوش مصنوعی چندوجهی خود، Gemini 2.5 Pro، را به یک «مدل جهانی» تبدیل کند که جنبه‌هایی از مغز انسان را شبیه‌سازی می‌کند. همچنین چندی پیش از مدل Genie 2 رونمایی کرد که قادر به تولید «بی‌نهایت» دنیای قابل بازی است. در کنار این‌ها، گوگل تیمی جدید برای کار روی مدل‌های شبیه‌ساز دنیای واقعی تشکیل داده است.

البته گوگل در این مسیر تنها نیست. «فی‌فی لی»، از پیشگامان هوش مصنوعی، با استارتاپ خود به نام World Labs، سیستمی ساخته که از روی یک عکس، صحنه‌های سه‌بعدی شبیه به بازی‌های ویدیویی تولید می‌کند.

Veo 3 در حال حاضر چه توانایی‌هایی دارد؟

مدل Veo 3 که هنوز در مرحله پیش‌نمایش عمومی قرار دارد، می‌تواند علاوه بر ویدیو، صدای متناسب با آن، از جمله دیالوگ و موسیقی متن را نیز تولید کند. این مدل با شبیه‌سازی فیزیک دنیای واقعی، حرکات بسیار طبیعی خلق می‌کند، اما هنوز یک «مدل جهانی» کامل نیست. در حال حاضر، از Veo 3 می‌توان برای ساخت بخش‌های سینمایی بازی‌ها مانند میان‌پرده‌ها، تریلرها و طراحی اولیه داستان استفاده کرد.

با این حال، Veo 3 هنوز یک مدل با خروجی «منفعل» است و برای تبدیل شدن به یک بازی، باید به یک شبیه‌ساز فعال، تعاملی و پیش‌بینی‌کننده تبدیل شود.

چالش اصلی و آینده احتمالی

چالش اصلی در ساخت بازی‌های ویدیویی، نه فقط تولید تصاویر زیبا، بلکه شبیه‌سازیِ آنی، پایدار و قابل کنترل است. به همین دلیل، کارشناسان معتقدند گوگل در آینده ممکن است از یک رویکرد ترکیبی استفاده کند و قابلیت‌های Veo 3 را با مدلی مانند Genie ترکیب کند تا به دنیاهای قابل بازی دست یابد.

گوگل در این رقابت با شرکت‌هایی مانند مایکروسافت، Runway، Pika و حتی OpenAI با مدل پر سر و صدای Sora روبرو خواهد شد. با توجه به سرمایه‌گذاری‌های عظیم گوگل و توانایی این شرکت در تسلط بر بازار، رقبا باید با دقت حرکات بعدی این غول فناوری را زیر نظر داشته باشند.

منابع