شواهد فاششده نشان میدهد که شرکت OpenAI در آستانه انتشار یک مدل هوش مصنوعی قدرتمند و متنباز جدید قرار دارد و این اتفاق ممکن است ظرف چند ساعت آینده رخ دهد.
این شواهد از مجموعهای از سرنخهای دیجیتال به دست آمده که توجه توسعهدهندگان را به خود جلب کرده است. در مرکز این ماجرا، اسکرینشاتهایی از چند مخزن مدل (repositories) با نامهایی مانند yofo-deepcurrent/gpt-oss-120b و yofo-wildflower/gpt-oss-20b قرار دارد. اگرچه این مخازن اکنون حذف شدهاند، اما حسابهای کاربری مرتبط با آنها به اعضای تیم OpenAI تعلق دارند.
برچسب gpt-oss سرنخ اصلی این ماجراست و به نظر میرسد نشانهای واضح از عبارت «نرمافزار متنباز GPT» باشد. برای شرکتی که مدلهای سطح بالای خود را به طور فزایندهای محرمانه نگه داشته، این اقدام به نوعی بازگشت به ریشههایش محسوب میشود. وجود نسخههای متعدد با اسم رمزها و اندازههای مختلف نیز نشان میدهد که خانوادهای از مدلهای کاملاً برنامهریزیشده در آستانه رونمایی قرار دارند.
سرنخها و شواهد دیجیتال از مدل GPT متنباز
به لطف یک فایل پیکربندی فاششده، حتی میتوانیم نگاهی به ساختار داخلی نسخه ۱۲۰ میلیارد پارامتری این مدل بیندازیم. به نظر میرسد این مدل بر اساس معماری «ترکیبی از متخصصان» (Mixture of Experts یا MoE) ساخته شده است. این معماری را به جای یک مغز واحد و یکپارچه که تلاش میکند همه چیز را بداند، میتوان به هیئتی متشکل از ۱۲۸ مشاور متخصص تشبیه کرد.
زمانی که یک درخواست به سیستم ارسال میشود، سیستم هوشمندانه چهار متخصص برتر را برای انجام آن کار انتخاب میکند. این روش باعث میشود مدل هم دانش گستردهای معادل تعداد پارامترهای عظیم خود داشته باشد و هم سرعت و چابکی یک سیستم بسیار کوچکتر را، زیرا در هر لحظه تنها بخشی از آن فعال است.
این طراحی، مدل متنباز OpenAI را مستقیماً در رقابت با مدلهای محبوب این حوزه مانند Mixtral از شرکت Mistral AI و خانواده Llama از شرکت متا قرار میدهد.
مشخصات فنی به همین جا ختم نمیشود. به نظر میرسد مدل متنباز OpenAI از دایره واژگان بسیار وسیعی برخوردار است که کارایی آن را در پردازش زبانهای مختلف افزایش میدهد. همچنین از مکانیزم «توجه پنجرهای لغزان» (Sliding Window Attention) برای پردازش متون طولانی بدون هیچ مشکلی استفاده میکند. در عمل، تمام این ویژگیها به مدلی اشاره دارد که هم قدرتمند است و هم اجرای آن بهینه خواهد بود.
پیامدها و دلایل احتمالی این اقدام
اما چرا OpenAI باید اکنون چنین حرکتی انجام دهد؟ این شرکت سالهاست که به دلیل فاصله گرفتن از ریشههای متنباز خود، با انتقادات مختلفی روبهرو بوده است. انتشار یک مدل قدرتمند gpt-oss میتواند یک اقدام بزرگ برای جلب نظر توسعهدهندگان و محققانی باشد که احساس میکردند کنار گذاشته شدهاند.
البته این یک حرکت رقابتی هوشمندانه نیز محسوب میشود. شرکتهای متا و میسترال نشان دادهاند که یک اکوسیستم متنباز پویا چگونه میتواند به نوآوری دامن بزند. OpenAI با عرضه چنین مدل قدرتمندی، نه تنها به این رقابت وارد میشود، بلکه تلاش میکند قواعد بازی را از نو تعریف کند.
تا زمانی که خبر رسمی از سوی OpenAI منتشر نشود، تمام اینها از نظر فنی در حد شایعه باقی میماند؛ اما شایعهای مستند که با کدها و فایلهای پیکربندی پشتیبانی میشود.
انتشار یک مدل متنباز MoE با عملکرد بالا و ۱۲۰ میلیارد پارامتر از سوی مشهورترین نام دنیای هوش مصنوعی، یک نقطه عطف بزرگ خواهد بود و به نظر میرسد این اتفاق قریبالوقوع است.