این هفته انگار نوبت مدلهای هوش مصنوعی کوچک است! روز پنجشنبه، مؤسسه تحقیقاتی هوش مصنوعی غیرانتفاعی Ai2، از مدل جدیدی به نام Olmo 2 1B رونمایی کرد. این مدل تنها ۱ میلیارد پارامتر دارد و Ai2 ادعا میکند که در چندین آزمایش مقایسهای، از مدلهای هماندازه شرکتهای بزرگی مثل گوگل، متا و علیبابا بهتر عمل میکند. پارامترها را میتوان به عنوان بخشهای درونی و اصلی مدل هوش مصنوعی در نظر گرفت که نحوه عملکرد آن را تعیین میکنند.
مدل Olmo 2 1B با مجوزی آزاد (Apache 2.0) روی پلتفرم توسعه هوش مصنوعی Hugging Face در دسترس است. یکی از ویژگیهای منحصر به فرد Olmo 2 1B این است که میتوان آن را از ابتدا بازسازی کرد، چون Ai2 کد و مجموعهدادههایی (با نامهای Olmo-mix-1124 و Dolmino-mix-1124) که برای ساخت آن استفاده کرده، منتشر کرده است.
اجرای Olmo 2 1B روی لپتاپ و موبایل ممکن است
شاید مدلهای کوچک به اندازه مدلهای بسیار بزرگ توانایی نداشته باشند، اما نکته مهم اینجاست که برای اجرا به سختافزار قدرتمند نیاز ندارند. این ویژگی آنها را برای توسعهدهندگان و علاقهمندانی که از کامپیوترها و سختافزارهای معمولی استفاده میکنند، بسیار قابل دسترستر میکند.
در چند روز گذشته شاهد معرفی مدلهای هوش مصنوعی کوچک متعددی بودهایم، از مدلهای استدلالگر Phi 4 مایکروسافت گرفته تا Qwen 2.5 Omni 3B. بیشتر این مدلها، از جمله Olmo 2 1B، به راحتی روی یک لپتاپ امروزی یا حتی یک دستگاه موبایل قابل اجرا هستند.
Ai2 میگوید Olmo 2 1B روی مجموعهدادهای عظیم شامل ۴ تریلیون توکن آموزش دیده است. این دادهها از منابع عمومی، محتوای تولید شده توسط هوش مصنوعی و محتوای ساخته شده به صورت دستی جمعآوری شدهاند. توکنها واحدهای اولیه داده هستند که مدلها آنها را ورودی میگیرند و تولید میکنند؛ هر یک میلیون توکن تقریباً معادل ۷۵۰ هزار کلمه است.
در آزمایشی به نام GSM8K که توانایی حل مسائل ریاضی را میسنجد، Olmo 2 1B امتیاز بهتری نسبت به مدلهای Gemma 3 1B گوگل، Llama 3.2 1B متا و Qwen 2.5 1.5B علیبابا کسب کرده است. این مدل همچنین در آزمون TruthfulQA که صحت اطلاعات و واقعگویی مدل را ارزیابی میکند، بهتر از این سه مدل عمل میکند.
با این حال، Ai2 هشدار داده است که Olmo 2 1B بیخطر نیست. این سازمان اعلام کرده مانند تمام مدلهای هوش مصنوعی، این مدل نیز میتواند خروجیهای مشکلساز تولید کند، از جمله محتوای مضر و حساس و همچنین اطلاعات نادرست. به همین دلایل، Ai2 توصیه میکند که از Olmo 2 1B در کاربردهای تجاری حساس استفاده نشود.