طبق اطلاعات لورفته، انتشار مدل هوش مصنوعی متن‌باز OpenAI قریب‌الوقوع است

آخرین به‌روزرسانی: 17 مرداد 1404, 9:36 ب.ظ

رضا باقری 16 مرداد 1404 اخبار و رویداد ۴ دقیقه زمان مطالعه 0 دیدگاه ( ۰ امتیاز )

شواهد فاش‌شده نشان می‌دهد که شرکت OpenAI در آستانه انتشار یک مدل هوش مصنوعی قدرتمند و متن‌باز جدید قرار دارد و این اتفاق ممکن است ظرف چند ساعت آینده رخ دهد.

این شواهد از مجموعه‌ای از سرنخ‌های دیجیتال به دست آمده که توجه توسعه‌دهندگان را به خود جلب کرده است. در مرکز این ماجرا، اسکرین‌شات‌هایی از چند مخزن مدل (repositories) با نام‌هایی مانند yofo-deepcurrent/gpt-oss-120b و yofo-wildflower/gpt-oss-20b قرار دارد. اگرچه این مخازن اکنون حذف شده‌اند، اما حساب‌های کاربری مرتبط با آن‌ها به اعضای تیم OpenAI تعلق دارند.

برچسب gpt-oss سرنخ اصلی این ماجراست و به نظر می‌رسد نشانه‌ای واضح از عبارت «نرم‌افزار متن‌باز GPT» باشد. برای شرکتی که مدل‌های سطح بالای خود را به طور فزاینده‌ای محرمانه نگه داشته، این اقدام به نوعی بازگشت به ریشه‌هایش محسوب می‌شود. وجود نسخه‌های متعدد با اسم‌ رمزها و اندازه‌های مختلف نیز نشان می‌دهد که خانواده‌ای از مدل‌های کاملاً برنامه‌ریزی‌شده در آستانه رونمایی قرار دارند.

سرنخ‌ها و شواهد دیجیتال از مدل GPT متن‌باز

طبق اطلاعات لورفته، انتشار مدل هوش مصنوعی متن‌باز OpenAI قریب‌الوقوع است

به لطف یک فایل پیکربندی فاش‌شده، حتی می‌توانیم نگاهی به ساختار داخلی نسخه ۱۲۰ میلیارد پارامتری این مدل بیندازیم. به نظر می‌رسد این مدل بر اساس معماری «ترکیبی از متخصصان» (Mixture of Experts یا MoE) ساخته شده است. این معماری را به جای یک مغز واحد و یکپارچه که تلاش می‌کند همه چیز را بداند، می‌توان به هیئتی متشکل از ۱۲۸ مشاور متخصص تشبیه کرد.

زمانی که یک درخواست به سیستم ارسال می‌شود، سیستم هوشمندانه چهار متخصص برتر را برای انجام آن کار انتخاب می‌کند. این روش باعث می‌شود مدل هم دانش گسترده‌ای معادل تعداد پارامترهای عظیم خود داشته باشد و هم سرعت و چابکی یک سیستم بسیار کوچک‌تر را، زیرا در هر لحظه تنها بخشی از آن فعال است.

این طراحی، مدل متن‌باز OpenAI را مستقیماً در رقابت با مدل‌های محبوب این حوزه مانند Mixtral از شرکت Mistral AI و خانواده Llama از شرکت متا قرار می‌دهد.

مشخصات فنی به همین جا ختم نمی‌شود. به نظر می‌رسد مدل متن‌باز OpenAI از دایره واژگان بسیار وسیعی برخوردار است که کارایی آن را در پردازش زبان‌های مختلف افزایش می‌دهد. همچنین از مکانیزم «توجه پنجره‌ای لغزان» (Sliding Window Attention) برای پردازش متون طولانی بدون هیچ مشکلی استفاده می‌کند. در عمل، تمام این ویژگی‌ها به مدلی اشاره دارد که هم قدرتمند است و هم اجرای آن بهینه خواهد بود.

سرنخ‌ها و شواهد دیجیتال از مدل GPT متن‌باز

پیامدها و دلایل احتمالی این اقدام

اما چرا OpenAI باید اکنون چنین حرکتی انجام دهد؟ این شرکت سال‌هاست که به دلیل فاصله گرفتن از ریشه‌های متن‌باز خود، با انتقادات مختلفی روبه‌رو بوده است. انتشار یک مدل قدرتمند gpt-oss می‌تواند یک اقدام بزرگ برای جلب نظر توسعه‌دهندگان و محققانی باشد که احساس می‌کردند کنار گذاشته شده‌اند.

البته این یک حرکت رقابتی هوشمندانه نیز محسوب می‌شود. شرکت‌های متا و میسترال نشان داده‌اند که یک اکوسیستم متن‌باز پویا چگونه می‌تواند به نوآوری دامن بزند. OpenAI با عرضه چنین مدل قدرتمندی، نه تنها به این رقابت وارد می‌شود، بلکه تلاش می‌کند قواعد بازی را از نو تعریف کند.

تا زمانی که خبر رسمی از سوی OpenAI منتشر نشود، تمام این‌ها از نظر فنی در حد شایعه باقی می‌ماند؛ اما شایعه‌ای مستند که با کدها و فایل‌های پیکربندی پشتیبانی می‌شود.

انتشار یک مدل متن‌باز MoE با عملکرد بالا و ۱۲۰ میلیارد پارامتر از سوی مشهورترین نام دنیای هوش مصنوعی، یک نقطه عطف بزرگ خواهد بود و به نظر می‌رسد این اتفاق قریب‌الوقوع است.

منابع