جی‌پی‌تی-۵ از راه رسید؛ بررسی نقاط قوت و ضعف نسل جدید هوش مصنوعی

آخرین به‌روزرسانی: 21 مرداد 1404, 9:29 ق.ظ

رضا باقری 20 مرداد 1404 اخبار و رویداد ۷ دقیقه زمان مطالعه 0 دیدگاه ( ۰ امتیاز )

تیم OpenAI به رهبری سم آلتمن سرانجام از مدل زبان جدید خود، جی‌پی‌تی-۵ (GPT-5)، رونمایی کرد. این رویداد با استقبال چشمگیری مواجه شد و حدود ۶۰۰ هزار نفر آن را به صورت زنده یا در سه ساعت اول پس از پخش، تماشا کردند.

هرچند این آمار هنوز با رویدادهایی مانند پرتاب‌های فضایی مهم یا فینال جام جهانی فاصله دارد، اما نشان‌دهنده علاقه شدید افکار عمومی به نسخه جدید چت جی پی تی است. بر اساس داده‌های موجود، تنها دو یا سه رویداد اپل در گذشته توانسته‌اند مخاطبان بیشتری را برای پخش زنده خود جذب کنند.

من پیش از رونمایی رسمی، به نسخه‌ای از جی‌پی‌تی-۵ دسترسی داشتم و تقریباً تمام انتظاراتی که از آن می‌رفت، در این مراسم تأیید شد. در ادامه به بررسی جنبه‌هایی می‌پردازم که مرا شگفت‌زده کرد (واکنش «وای!») و نکاتی که باعث شد به فکر فرو بروم (واکنش «هوممم…»).

پیشرفت فوق‌العاده در کمتر از سه سال

جی‌پی‌تی-۵ از راه رسید؛ بررسی نقاط قوت و ضعف نسل جدید هوش مصنوعی

بسیاری از تحلیل‌گران، از جمله خود من، بارها از «توهم» (ارائه اطلاعات غلط)، خطاها و ایرادات مدل‌های قبلی شکایت کرده‌ایم. همه این انتقادها درست است، اما باید نفسی عمیق بکشیم و به پیشرفت عظیمی که OpenAI از زمان عرضه اولین نسخه عمومی چت‌جی‌پی‌تی داشته، اذعان کنیم. آن نسخه اولیه بیشتر یک اسباب‌بازی بود تا یک ابزار. اما نسخه‌های فعلی (۴.۰، ۴.۱ و ۴.۵) بسیار قدرتمند و کاربردی هستند.

اگر جی پی تی ۵ حتی به نیمی از وعده‌های داده‌شده عمل کند، یک جهش بزرگ رو به جلو خواهد بود. نکته شگفت‌انگیز دیگر زمانی بود که سم آلتمن اعلام کرد تعداد کاربران این پلتفرم به ۷۰۰ میلیون نفر رسیده است. جاه‌طلبی OpenAI ستودنی است و مرا به یاد جمله‌ای از لئو برنت، اسطوره دنیای تبلیغات، می‌اندازد: «وقتی برای رسیدن به ستاره‌ها تلاش می‌کنی، شاید به آن‌ها نرسی، اما دست‌کم با مشتی گل و لای هم برنمی‌گردی.» واضح است که OpenAI ستاره‌ها را هدف گرفته است.

حذف مدل‌های قدیمی و انتقال همه کاربران به جی‌پی‌تی-۵

تا پیش از این، در منوی بالای صفحه چت‌جی‌پی‌تی گزینه‌های مختلفی برای مدل‌های گوناگون وجود داشت که انتخاب میان آن‌ها حداقل برای من گیج‌کننده بود. اکنون OpenAI همه کاربران را به جی‌پی‌تی-۵ منتقل کرده و مدل‌های قدیمی‌تر را غیرفعال می‌کند. جدول زیر تفاوت‌های اصلی میان جی‌پی‌تی-۴ و جی‌پی‌تی-۵ را نشان می‌دهد. به گفته آلتمن، اگر جی‌پی‌تی-۳ یک دانش‌آموز دبیرستانی و جی‌پی‌تی-۴ یک دانشجو بود، جی‌پی‌تی-۵ در سطح یک دکترای تخصصی عمل خواهد کرد. این نسخه به‌زودی برای همه کاربران تجاری در دسترس قرار می‌گیرد. کاربران رایگان نیز با محدودیت استفاده مواجه خواهند بود و پس از عبور از سقف مجاز، به مدلی با قدرت کمتر منتقل می‌شوند.

ویژگی	جی‌پی‌تی–۴	جی‌پی‌تی–۵ (مورد انتظار)
توانایی استدلال	قوی، با خطاهای منطقی گاه‌به‌گاه	نزدیک به سطح استدلال دکترا
پشتیبانی چندرسانه‌ای	متن، تصویر، صدا	متن، تصویر، صدا، ویدیو
حافظه زمینه (Context)	تا حدود ۱۲۸ هزار توکن	تا حدود ۱ میلیون توکن
استقلال عامل هوشمند	محدود، نیازمند ورودی مکرر	مستقل‌تر، انجام وظایف چندمرحله‌ای
گزینه‌های سرعت	یک مدل اصلی	نسخه‌های پرچم‌دار، مینی و نانو
پشتیبانی از ویدیو	عدم پشتیبانی	درک و تولید کامل ویدیو

توهم و خطاهای کمتر

OpenAI تأکید کرده است که جی‌پی‌تی-۵ نسبت به نسخه‌های قبلی، زمان کمتری را در «دنیای خیال‌پردازی» و ارائه اطلاعات غلط سپری خواهد کرد. این خبر بسیار خوبی است، البته اگر صحت داشته باشد. آن‌ها به بهبود درصدی اشاره کردند اما جزئیات محاسبات خود را نشان ندادند. حس من می‌گوید که این بهبود محسوس خواهد بود، اما هنوز به سطح بی‌نقص نرسیده است.

یکپارچگی بسیار قوی‌تر با صدا

در نسخه‌های قبلی، برخی کاربران از ورودی صوتی برای کار با چت‌جی‌پی‌تی استفاده می‌کردند. واضح است که تلاش بزرگی برای ارتقای قابلیت‌های صوتی به سطح ورودی متنی انجام شده است. این یک گزینه عالی است، هرچند هنوز مشخص نیست چه سهمی از استفاده کاربران را به خود اختصاص خواهد داد. بخشی از تردید من به دلیل خوش‌بینی بیش از حدی است که زمانی درباره دستیار صوتی الکسا و تحول‌آفرینی آن در آمازون وجود داشت. من دنیایی را تصور می‌کردم که مردم هنگام آشپزی در آشپزخانه، مواد غذایی سفارش می‌دهند، اما این اتفاق رخ نداد. تایپ کردن ممکن است همچنان روش ورودی ترجیحی بسیاری از افراد باقی بماند.

توسعه کد بسیار قدرتمندتر

این ویژگی هم جنبه مثبت دارد و هم منفی. در دموی ارائه شده، تلاش شد تا سادگی ساخت اپلیکیشن‌های وب با جی‌پی‌تی-۵ نمایش داده شود. در یک نمونه، فردی اپلیکیشنی ساخت تا به دوستش برای صحبت به زبان فرانسوی با خانواده‌اش کمک کند. نتیجه تا حدودی کار می‌کرد، اما بیشتر شبیه یک پروژه دبیرستانی بود تا یک محصول حرفه‌ای. OpenAI ادعا می‌کند که برنامه‌نویسان کار با جی‌پی‌تی-۵ را ترجیح می‌دهند، اما منبع یا مدرکی برای این ادعا ارائه نکرد. این ویژگی را در دسته «عالی، اگر واقعاً عملی شود» قرار می‌دهم.

گام‌های بزرگ در مقابله با سوءاستفاده‌کنندگان

شعار «اول، آسیب نرسان» گویا در OpenAI جدی گرفته شده است. در این مراسم توضیح داده شد که جی‌پی‌تی-۵ چگونه به جستجوهای مشکل‌ساز پاسخ خواهد داد. این مدل، زمینه بیشتری درباره اینکه چرا یک موضوع اشتباه، غیراخلاقی یا خطرناک است ارائه می‌دهد. آن‌ها این ویژگی را «تکمیل ایمن» (safe completion) نامیده‌اند. این روند قطعاً ارزش پیگیری در آینده را دارد.

اجرایی شبیه ارائه کلاسی، نه رونمایی یک شرکت بزرگ

شاید شرکت‌هایی مانند اپل سطح توقع ما را بالا برده‌اند، اما اجرای این مراسم بسیار آماتوری بود. مدیران محصول با حالتی مضطرب و برای بخش‌های سه‌دقیقه‌ای روی صحنه می‌آمدند و می‌رفتند. بسیاری از شوخی‌ها بداهه و نچسب به نظر می‌رسیدند. می‌دانم که اصل، خود محصول است نه بسته‌بندی آن، اما به نظر می‌رسد وقت آن رسیده که OpenAI سطح ارائه خود را نیز حرفه‌ای‌تر کند.

ناتوانی در ترجمه هیجان و ایده‌های فنی به زبان ساده

در یک مثال جالب، نشان داده شد که چگونه یک والد می‌تواند به فرزند دبیرستانی خود در تهیه گزارش علمی درباره «اثر برنولی» کمک کند. تا اینجا همه چیز خوب بود. سپس مجری پرسید: «آیا عالی نیست که یک انیمیشن برای نمایش این اثر داشته باشیم؟» بله! و اگر او این فرآیند را به زبان ساده توضیح می‌داد، فوق‌العاده می‌شد. اما در عوض، از اصطلاحات فنی مانند «یک SVG با استفاده از Canva بساز» استفاده کرد و انبوهی از کدهای پایتون را نمایش داد. هنوز فرصت زیادی برای دسترس‌پذیر کردن قدرت جی‌پی‌تی-۵ برای کاربر عادی وجود دارد، اما این کار نیازمند ارائه به زبان خودِ کاربران است.

ادعای یک جهش دو یا سه ساله در تکامل هوش مصنوعی

یکی از دانشمندان برجسته هوش مصنوعی، دانیل کوکوتایلو است که پیش از جدایی، از مهندسان ارشد OpenAI بود. او نویسنده اصلی مقاله معتبر «هوش مصنوعی ۲۰۲۷» است که مسیر توسعه این فناوری را مستند کرده است. طبق آن مقاله، هنوز دو تا سه سال زمان لازم است تا هوش مصنوعی بتواند بخش عمده‌ای از کار یک توسعه‌دهنده نرم‌افزار را انجام دهد. اما OpenAI ادعا می‌کند که با جی‌پی‌تی-۵ در حال رسیدن به آن نقطه است. من هنوز با این ادعا قانع نشده‌ام. شاید در مسیر درستی باشند، اما آیا به مقصد رسیده‌اند؟ تا زمانی که شواهد بیشتری نبینم، تردید خواهم داشت.

منابع