گرانترین مدل هوش مصنوعی گوگل به یک نقطه عطف بزرگ دست یافته است: اتمام موفقیتآمیز یک بازی ویدیویی ۲۹ ساله.
شب گذشته، ساندار پیچای، مدیرعامل گوگل، در پلتفرم X (توییتر سابق) اعلام کرد که جیمنای ۲.۵ پرو همین حالا پوکمون بلو را به پایان رسانده است. او این پایان را هیجانانگیز توصیف کرد.
جیمنای چگونه از پس پوکمون بلو برآمد؟
برای روشن شدن موضوع، پخش زنده جیمنای پوکمون بازی میکند توسط فردی به نام جوئل زی ایجاد شده است که خود میگوید یک مهندس نرمافزار ۳۰ ساله بدون وابستگی به گوگل است. با این حال، مدیران اجرایی گوگل این تلاش را تحسین و تشویق کردهاند.
به عنوان مثال، لوگان کیلپاتریک، مدیر محصول گوگل اِیآی استودیو، ماه گذشته گزارش داد که جیمنای پیشرفت خوبی در اتمام پوکمون داشته و پنجمین نشان (Badge) خود را کسب کرده است؛ او اشاره کرد که بهترین مدل رقیب تا آن زمان تنها سه نشان به دست آورده بود (البته با ابزارهای متفاوتی). در واکنش به این خبر، پیچای شوخی کرد و گفت که در حال کار بر روی هوش مصنوعی پوکمون هستند.
نقش انسان، سیستمهای کمکی و چالشهای جیمنای در مسیر اتمام بازی
اما چرا پوکمون انتخاب شد؟ در ماه فوریه، شرکت آنتروپیک پیشرفتهای مدلهای هوش مصنوعی کلود خود را در بازی پوکمون رد برجسته کرده بود. این شرکت بیان کرده بود که قابلیتهای تفکر عمیق و آموزش عامل در کلود، به آن برای انجام کارهای غیرمنتظرهتر مانند بازیهای کلاسیک، کمک قابل توجهی میکند. پوکمون رد و بلو نسخههای متفاوتی از یک بازی گیمبوی هستند که در سال ۱۹۹۶ منتشر شدند و بخشی از مجموعه گسترده پوکمون محسوب میشوند. کانال توییچ کلود پوکمون بازی میکند نیز وجود دارد که جوئل زی آن را به عنوان الهامبخش کار خود ذکر کرده است.
با وجود پیشرفت کلود در پوکمون رد، به نظر نمیرسد این مدل تاکنون بازی را به پایان رسانده باشد. آیا این نشان میدهد که جیمنای بهطور عینی در این بازی بهتر است؟ در صفحه توییچ خود، جوئل زی از بینندگان خواسته است که این پروژه را به عنوان معیاری برای سنجش عملکرد کلی مدلهای زبان بزرگ (LLM) در بازی پوکمون در نظر نگیرند. او توضیح داده است که امکان مقایسه مستقیم وجود ندارد، زیرا جیمنای و کلود از ابزارها و اطلاعات متفاوتی بهره میبرند.
هر دو مدل هوش مصنوعی برای انجام بازی به کمک نیاز دارند. این کمک از طریق سیستمی فراهم میشود که اسکرینشاتهای بازی را به همراه اطلاعات اضافی به مدلها ارائه میدهد. این سیستم به مدل هوش مصنوعی امکان میدهد تا تصمیم بگیرد چه اقدامی انجام دهد (که گاهی نیاز به فراخوانی بخشهای تخصصی دارد) و سپس دستور مربوطه را در بازی اجرا کند.
جوئل زی اعتراف کرد که مداخلات دیگری از سوی توسعهدهنده برای کمک به جیمنای جهت اتمام بازی صورت گرفته است، اما تأکید کرد که این اقدامات تقلب محسوب نمیشوند.
او توضیح میدهد که این مداخلات باعث بهبود تواناییهای کلی تصمیمگیری و استدلال جیمنای میشوند. او میگوید که نکات مشخصی ارائه نمیدهد، یعنی هیچ راهنما یا دستورالعمل مستقیمی برای حل چالشهای خاصی مانند کوهستان مون وجود ندارد. تنها مورد نزدیک به این، اطلاعرسانی به جیمنای بود که برای به دست آوردن کلید آسانسور باید دو بار با یک عضو گروه راکت صحبت کند؛ این موضوع مربوط به ایراد نرمافزاری در بازی اصلی بود که بعدها در نسخه پوکمون یلو برطرف شد.
علاوه بر این، جوئل زی اشاره کرد که پروژه جیمنای پوکمون بازی میکند همچنان به طور فعال در حال توسعه و سیستم آن پیوسته در حال تکامل است.