دمیس هسابیس، مدیرعامل دیپمایند (بازوی تحقیقاتی هوش مصنوعی گوگل)، با یک اشاره تلویحی، گمانهزنیها درباره استفاده از جدیدترین مدل هوش مصنوعی این شرکت، یعنی Veo 3، در ساخت بازیهای ویدیویی را برانگیخت.
ماجرا از یک پست در شبکه اجتماعی ایکس (توییتر سابق) شروع شد. کاربری از گوگل خواسته بود: «اجازه بدهید با ویدیوهایی که Veo 3 میسازد، بازی کنم. مدلهای جهانِ قابل بازی کی از راه میرسند؟» هسابیس در پاسخی کوتاه و معنادار نوشت: «این ایده فوقالعادهای خواهد بود.»
هرچند این پاسخها فعلاً در حد یک اشاره غیررسمی است و سخنگوی گوگل نیز اعلام کرده که این شرکت در حال حاضر اطلاعات بیشتری برای به اشتراک گذاشتن ندارد، اما ایده ساخت دنیاهای قابل بازی با هوش مصنوعی برای غول فناوری مانند گوگل، دور از ذهن نیست.
تفاوت «مدل جهانی» با «مدل تولید ویدیو» چیست؟
باید توجه داشت که «مدلهای جهانی» (World Models) با مدلهای تولید ویدیو تفاوت دارند. یک مدل تولید ویدیو، مانند Veo 3، تنها ویدیوهای واقعگرایانه میسازد. اما یک «مدل جهانی»، محیطی مجازی را شبیهسازی میکند و به هوش مصنوعی اجازه میدهد تا پیشبینی کند در پاسخ به اقدامات کاربر، دنیای اطراف چگونه تغییر خواهد کرد. به زبان ساده، اولی یک فیلمساز است و دومی یک شبیهساز تعاملی.
جاهطلبیهای گوگل در ساخت دنیاهای مجازی
گوگل پیش از این نیز جاهطلبیهای خود را در این زمینه نشان داده است. این شرکت قصد دارد مدل هوش مصنوعی چندوجهی خود، Gemini 2.5 Pro، را به یک «مدل جهانی» تبدیل کند که جنبههایی از مغز انسان را شبیهسازی میکند. همچنین چندی پیش از مدل Genie 2 رونمایی کرد که قادر به تولید «بینهایت» دنیای قابل بازی است. در کنار اینها، گوگل تیمی جدید برای کار روی مدلهای شبیهساز دنیای واقعی تشکیل داده است.
البته گوگل در این مسیر تنها نیست. «فیفی لی»، از پیشگامان هوش مصنوعی، با استارتاپ خود به نام World Labs، سیستمی ساخته که از روی یک عکس، صحنههای سهبعدی شبیه به بازیهای ویدیویی تولید میکند.
Veo 3 در حال حاضر چه تواناییهایی دارد؟
مدل Veo 3 که هنوز در مرحله پیشنمایش عمومی قرار دارد، میتواند علاوه بر ویدیو، صدای متناسب با آن، از جمله دیالوگ و موسیقی متن را نیز تولید کند. این مدل با شبیهسازی فیزیک دنیای واقعی، حرکات بسیار طبیعی خلق میکند، اما هنوز یک «مدل جهانی» کامل نیست. در حال حاضر، از Veo 3 میتوان برای ساخت بخشهای سینمایی بازیها مانند میانپردهها، تریلرها و طراحی اولیه داستان استفاده کرد.
با این حال، Veo 3 هنوز یک مدل با خروجی «منفعل» است و برای تبدیل شدن به یک بازی، باید به یک شبیهساز فعال، تعاملی و پیشبینیکننده تبدیل شود.
چالش اصلی و آینده احتمالی
چالش اصلی در ساخت بازیهای ویدیویی، نه فقط تولید تصاویر زیبا، بلکه شبیهسازیِ آنی، پایدار و قابل کنترل است. به همین دلیل، کارشناسان معتقدند گوگل در آینده ممکن است از یک رویکرد ترکیبی استفاده کند و قابلیتهای Veo 3 را با مدلی مانند Genie ترکیب کند تا به دنیاهای قابل بازی دست یابد.
گوگل در این رقابت با شرکتهایی مانند مایکروسافت، Runway، Pika و حتی OpenAI با مدل پر سر و صدای Sora روبرو خواهد شد. با توجه به سرمایهگذاریهای عظیم گوگل و توانایی این شرکت در تسلط بر بازار، رقبا باید با دقت حرکات بعدی این غول فناوری را زیر نظر داشته باشند.