مدل هوش مصنوعی کوچک جدید Ai2 از رقبای گوگل و متا پیشی گرفت

آخرین به‌روزرسانی: 18 مرداد 1404, 10:10 ب.ظ

رضا باقری 15 اردیبهشت 1404 اخبار و رویداد ۳ دقیقه زمان مطالعه 0 دیدگاه ( ۰ امتیاز )

این هفته انگار نوبت مدل‌های هوش مصنوعی کوچک است! روز پنجشنبه، مؤسسه تحقیقاتی هوش مصنوعی غیرانتفاعی Ai2، از مدل جدیدی به نام Olmo 2 1B رونمایی کرد. این مدل تنها ۱ میلیارد پارامتر دارد و Ai2 ادعا می‌کند که در چندین آزمایش مقایسه‌ای، از مدل‌های هم‌اندازه شرکت‌های بزرگی مثل گوگل، متا و علی‌بابا بهتر عمل می‌کند. پارامترها را می‌توان به عنوان بخش‌های درونی و اصلی مدل هوش مصنوعی در نظر گرفت که نحوه عملکرد آن را تعیین می‌کنند.

مدل Olmo 2 1B با مجوزی آزاد (Apache 2.0) روی پلتفرم توسعه هوش مصنوعی Hugging Face در دسترس است. یکی از ویژگی‌های منحصر به فرد Olmo 2 1B این است که می‌توان آن را از ابتدا بازسازی کرد، چون Ai2 کد و مجموعه‌داده‌هایی (با نام‌های Olmo-mix-1124 و Dolmino-mix-1124) که برای ساخت آن استفاده کرده، منتشر کرده است.

اجرای Olmo 2 1B روی لپ‌تاپ و موبایل ممکن است

مدل هوش مصنوعی کوچک جدید Ai2 از رقبای گوگل و متا پیشی گرفت

شاید مدل‌های کوچک به اندازه مدل‌های بسیار بزرگ توانایی نداشته باشند، اما نکته مهم اینجاست که برای اجرا به سخت‌افزار قدرتمند نیاز ندارند. این ویژگی آن‌ها را برای توسعه‌دهندگان و علاقه‌مندانی که از کامپیوترها و سخت‌افزارهای معمولی استفاده می‌کنند، بسیار قابل دسترس‌تر می‌کند.

در چند روز گذشته شاهد معرفی مدل‌های هوش مصنوعی کوچک متعددی بوده‌ایم، از مدل‌های استدلال‌گر Phi 4 مایکروسافت گرفته تا Qwen 2.5 Omni 3B. بیشتر این مدل‌ها، از جمله Olmo 2 1B، به راحتی روی یک لپ‌تاپ امروزی یا حتی یک دستگاه موبایل قابل اجرا هستند.

Ai2 می‌گوید Olmo 2 1B روی مجموعه‌داده‌ای عظیم شامل ۴ تریلیون توکن آموزش دیده است. این داده‌ها از منابع عمومی، محتوای تولید شده توسط هوش مصنوعی و محتوای ساخته شده به صورت دستی جمع‌آوری شده‌اند. توکن‌ها واحدهای اولیه داده هستند که مدل‌ها آن‌ها را ورودی می‌گیرند و تولید می‌کنند؛ هر یک میلیون توکن تقریباً معادل ۷۵۰ هزار کلمه است.

در آزمایشی به نام GSM8K که توانایی حل مسائل ریاضی را می‌سنجد، Olmo 2 1B امتیاز بهتری نسبت به مدل‌های Gemma 3 1B هوش مصنوعی گوگل، Llama 3.2 1B متا و Qwen 2.5 1.5B علی‌بابا کسب کرده است. این مدل همچنین در آزمون TruthfulQA که صحت اطلاعات و واقع‌گویی مدل را ارزیابی می‌کند، بهتر از این سه مدل عمل می‌کند.

با این حال، Ai2 هشدار داده است که Olmo 2 1B بی‌خطر نیست. این سازمان اعلام کرده مانند تمام مدل‌های هوش مصنوعی، این مدل نیز می‌تواند خروجی‌های مشکل‌ساز تولید کند، از جمله محتوای مضر و حساس و همچنین اطلاعات نادرست. به همین دلایل، Ai2 توصیه می‌کند که از Olmo 2 1B در کاربردهای تجاری حساس استفاده نشود.

منابع