تیم OpenAI به رهبری سم آلتمن سرانجام از مدل زبان جدید خود، جیپیتی-۵ (GPT-5)، رونمایی کرد. این رویداد با استقبال چشمگیری مواجه شد و حدود ۶۰۰ هزار نفر آن را به صورت زنده یا در سه ساعت اول پس از پخش، تماشا کردند.
هرچند این آمار هنوز با رویدادهایی مانند پرتابهای فضایی مهم یا فینال جام جهانی فاصله دارد، اما نشاندهنده علاقه شدید افکار عمومی به نسخه جدید چت جی پی تی است. بر اساس دادههای موجود، تنها دو یا سه رویداد اپل در گذشته توانستهاند مخاطبان بیشتری را برای پخش زنده خود جذب کنند.
من پیش از رونمایی رسمی، به نسخهای از جیپیتی-۵ دسترسی داشتم و تقریباً تمام انتظاراتی که از آن میرفت، در این مراسم تأیید شد. در ادامه به بررسی جنبههایی میپردازم که مرا شگفتزده کرد (واکنش «وای!») و نکاتی که باعث شد به فکر فرو بروم (واکنش «هوممم…»).
پیشرفت فوقالعاده در کمتر از سه سال
بسیاری از تحلیلگران، از جمله خود من، بارها از «توهم» (ارائه اطلاعات غلط)، خطاها و ایرادات مدلهای قبلی شکایت کردهایم. همه این انتقادها درست است، اما باید نفسی عمیق بکشیم و به پیشرفت عظیمی که OpenAI از زمان عرضه اولین نسخه عمومی چتجیپیتی داشته، اذعان کنیم. آن نسخه اولیه بیشتر یک اسباببازی بود تا یک ابزار. اما نسخههای فعلی (۴.۰، ۴.۱ و ۴.۵) بسیار قدرتمند و کاربردی هستند.
اگر جی پی تی ۵ حتی به نیمی از وعدههای دادهشده عمل کند، یک جهش بزرگ رو به جلو خواهد بود. نکته شگفتانگیز دیگر زمانی بود که سم آلتمن اعلام کرد تعداد کاربران این پلتفرم به ۷۰۰ میلیون نفر رسیده است. جاهطلبی OpenAI ستودنی است و مرا به یاد جملهای از لئو برنت، اسطوره دنیای تبلیغات، میاندازد: «وقتی برای رسیدن به ستارهها تلاش میکنی، شاید به آنها نرسی، اما دستکم با مشتی گل و لای هم برنمیگردی.» واضح است که OpenAI ستارهها را هدف گرفته است.
حذف مدلهای قدیمی و انتقال همه کاربران به جیپیتی-۵
تا پیش از این، در منوی بالای صفحه چتجیپیتی گزینههای مختلفی برای مدلهای گوناگون وجود داشت که انتخاب میان آنها حداقل برای من گیجکننده بود. اکنون OpenAI همه کاربران را به جیپیتی-۵ منتقل کرده و مدلهای قدیمیتر را غیرفعال میکند. جدول زیر تفاوتهای اصلی میان جیپیتی-۴ و جیپیتی-۵ را نشان میدهد. به گفته آلتمن، اگر جیپیتی-۳ یک دانشآموز دبیرستانی و جیپیتی-۴ یک دانشجو بود، جیپیتی-۵ در سطح یک دکترای تخصصی عمل خواهد کرد. این نسخه بهزودی برای همه کاربران تجاری در دسترس قرار میگیرد. کاربران رایگان نیز با محدودیت استفاده مواجه خواهند بود و پس از عبور از سقف مجاز، به مدلی با قدرت کمتر منتقل میشوند.
ویژگی | جیپیتی–۴ | جیپیتی–۵ (مورد انتظار) |
توانایی استدلال | قوی، با خطاهای منطقی گاهبهگاه | نزدیک به سطح استدلال دکترا |
پشتیبانی چندرسانهای | متن، تصویر، صدا | متن، تصویر، صدا، ویدیو |
حافظه زمینه (Context) | تا حدود ۱۲۸ هزار توکن | تا حدود ۱ میلیون توکن |
استقلال عامل هوشمند | محدود، نیازمند ورودی مکرر | مستقلتر، انجام وظایف چندمرحلهای |
گزینههای سرعت | یک مدل اصلی | نسخههای پرچمدار، مینی و نانو |
پشتیبانی از ویدیو | عدم پشتیبانی | درک و تولید کامل ویدیو |
توهم و خطاهای کمتر
OpenAI تأکید کرده است که جیپیتی-۵ نسبت به نسخههای قبلی، زمان کمتری را در «دنیای خیالپردازی» و ارائه اطلاعات غلط سپری خواهد کرد. این خبر بسیار خوبی است، البته اگر صحت داشته باشد. آنها به بهبود درصدی اشاره کردند اما جزئیات محاسبات خود را نشان ندادند. حس من میگوید که این بهبود محسوس خواهد بود، اما هنوز به سطح بینقص نرسیده است.
یکپارچگی بسیار قویتر با صدا
در نسخههای قبلی، برخی کاربران از ورودی صوتی برای کار با چتجیپیتی استفاده میکردند. واضح است که تلاش بزرگی برای ارتقای قابلیتهای صوتی به سطح ورودی متنی انجام شده است. این یک گزینه عالی است، هرچند هنوز مشخص نیست چه سهمی از استفاده کاربران را به خود اختصاص خواهد داد. بخشی از تردید من به دلیل خوشبینی بیش از حدی است که زمانی درباره دستیار صوتی الکسا و تحولآفرینی آن در آمازون وجود داشت. من دنیایی را تصور میکردم که مردم هنگام آشپزی در آشپزخانه، مواد غذایی سفارش میدهند، اما این اتفاق رخ نداد. تایپ کردن ممکن است همچنان روش ورودی ترجیحی بسیاری از افراد باقی بماند.
توسعه کد بسیار قدرتمندتر
این ویژگی هم جنبه مثبت دارد و هم منفی. در دموی ارائه شده، تلاش شد تا سادگی ساخت اپلیکیشنهای وب با جیپیتی-۵ نمایش داده شود. در یک نمونه، فردی اپلیکیشنی ساخت تا به دوستش برای صحبت به زبان فرانسوی با خانوادهاش کمک کند. نتیجه تا حدودی کار میکرد، اما بیشتر شبیه یک پروژه دبیرستانی بود تا یک محصول حرفهای. OpenAI ادعا میکند که برنامهنویسان کار با جیپیتی-۵ را ترجیح میدهند، اما منبع یا مدرکی برای این ادعا ارائه نکرد. این ویژگی را در دسته «عالی، اگر واقعاً عملی شود» قرار میدهم.
گامهای بزرگ در مقابله با سوءاستفادهکنندگان
شعار «اول، آسیب نرسان» گویا در OpenAI جدی گرفته شده است. در این مراسم توضیح داده شد که جیپیتی-۵ چگونه به جستجوهای مشکلساز پاسخ خواهد داد. این مدل، زمینه بیشتری درباره اینکه چرا یک موضوع اشتباه، غیراخلاقی یا خطرناک است ارائه میدهد. آنها این ویژگی را «تکمیل ایمن» (safe completion) نامیدهاند. این روند قطعاً ارزش پیگیری در آینده را دارد.
اجرایی شبیه ارائه کلاسی، نه رونمایی یک شرکت بزرگ
شاید شرکتهایی مانند اپل سطح توقع ما را بالا بردهاند، اما اجرای این مراسم بسیار آماتوری بود. مدیران محصول با حالتی مضطرب و برای بخشهای سهدقیقهای روی صحنه میآمدند و میرفتند. بسیاری از شوخیها بداهه و نچسب به نظر میرسیدند. میدانم که اصل، خود محصول است نه بستهبندی آن، اما به نظر میرسد وقت آن رسیده که OpenAI سطح ارائه خود را نیز حرفهایتر کند.
ناتوانی در ترجمه هیجان و ایدههای فنی به زبان ساده
در یک مثال جالب، نشان داده شد که چگونه یک والد میتواند به فرزند دبیرستانی خود در تهیه گزارش علمی درباره «اثر برنولی» کمک کند. تا اینجا همه چیز خوب بود. سپس مجری پرسید: «آیا عالی نیست که یک انیمیشن برای نمایش این اثر داشته باشیم؟» بله! و اگر او این فرآیند را به زبان ساده توضیح میداد، فوقالعاده میشد. اما در عوض، از اصطلاحات فنی مانند «یک SVG با استفاده از Canva بساز» استفاده کرد و انبوهی از کدهای پایتون را نمایش داد. هنوز فرصت زیادی برای دسترسپذیر کردن قدرت جیپیتی-۵ برای کاربر عادی وجود دارد، اما این کار نیازمند ارائه به زبان خودِ کاربران است.
ادعای یک جهش دو یا سه ساله در تکامل هوش مصنوعی
یکی از دانشمندان برجسته هوش مصنوعی، دانیل کوکوتایلو است که پیش از جدایی، از مهندسان ارشد OpenAI بود. او نویسنده اصلی مقاله معتبر «هوش مصنوعی ۲۰۲۷» است که مسیر توسعه این فناوری را مستند کرده است. طبق آن مقاله، هنوز دو تا سه سال زمان لازم است تا هوش مصنوعی بتواند بخش عمدهای از کار یک توسعهدهنده نرمافزار را انجام دهد. اما OpenAI ادعا میکند که با جیپیتی-۵ در حال رسیدن به آن نقطه است. من هنوز با این ادعا قانع نشدهام. شاید در مسیر درستی باشند، اما آیا به مقصد رسیدهاند؟ تا زمانی که شواهد بیشتری نبینم، تردید خواهم داشت.