یورش DeepSeek برای عرضه مدل جدید هوش مصنوعی در رقابت با غرب

تیم تحریریه 06 اسفند 1403 اخبار و رویداد ۵ دقیقه زمان مطالعه 0 دیدگاه ( ۱ امتیاز )

استارتاپ چینی DeepSeek قصد دارد از فرصت پیش‌آمده نهایت استفاده را ببرد. این شرکت ماه گذشته با معرفی یک مدل هوش مصنوعی ارزان‌قیمت، باعث سقوط بیش‌از یک تریلیون دلاری بازارهای سهام جهانی شد. این مدل از نظر قدرت استدلال از بسیاری از رقبای غربی بهتر عمل کرد.

DeepSeek که در هانگژو مستقر است، در حال سرعت بخشیدن به عرضه مدل جانشین R1 است که در ژانویه معرفی شد. به گفته سه منبع آگاه، این شرکت قصد داشت R2 را در اوایل ماه می عرضه کند؛ اما حالا تصمیم دارد هرچه زودتر آن را روانه بازار کند. هدف از عرضه R2 بهبود توانایی کدنویسی و ارتقای قابلیت استدلال در زبان‌هایی به‌جز انگلیسی است. این تصمیم در حالی گرفته شده که جزئیات مربوط به زمان دقیق عرضه هنوز به‌طور رسمی اعلام نشده است.

چالش جدید برای غول‌های هوش مصنوعی غربی

یورش DeepSeek برای عرضه مدل جدید هوش مصنوعی در رقابت با غرب

مدل R1 با استفاده از تراشه‌های ضعیف‌تر Nvidia ساخته شده؛ اما توانسته است با مدل‌هایی که با هزینه صدها میلیارد دلار توسط غول‌های فناوری آمریکا تولید شده‌اند، رقابت کند.

“ویجایاسیمها آلیلوقاتا، مدیر عملیاتی شرکت فناوری Zensar هند، معتقد است: «عرضه R2 می‌تواند لحظه‌ای تعیین‌کننده در صنعت هوش مصنوعی باشد.» او افزود: «موفقیت DeepSeek در تولید مدل‌های مقرون‌به‌صرفه احتمالاً باعث تسریع تلاش‌های جهانی و شکستن انحصار چند شرکت بزرگ در این حوزه خواهد شد.»

نگرانی ایالات متحده از پیشرفت DeepSeek

موفقیت این مدل ممکن است نگرانی دولت ایالات متحده را افزایش دهد؛ زیرا رهبری در حوزه هوش مصنوعی را یک اولویت ملی می‌داند. این در حالی است که شرکت‌های چینی، از جمله ده‌ها شرکتی که از مدل‌های DeepSeek استفاده می‌کنند، با سرعت زیادی در حال پیشرفت هستند.

موسس مرموز و سبک مدیریتی متفاوت

کمتر کسی در مورد DeepSeek و موسس آن، لیانگ ونفنگ، که از طریق صندوق پوشش ریسک High-Flyer به میلیاردها دلار دست یافت، اطلاعات دارد. او که به‌عنوان فردی «کم‌حرف و درون‌گرا» شناخته می‌شود، از جولای ۲۰۲۴ با هیچ رسانه‌ای مصاحبه نکرده است.

سبک مدیریتی لیانگ در DeepSeek و High-Flyer متفاوت از سنت‌های سخت‌گیرانه صنعت فناوری چین است. او از ساختارهای سلسله‌مراتبی و ساعات کاری فشرده (۹ صبح تا ۹ شب، شش روز در هفته) دوری کرده و محیطی مشارکتی با ساعات کاری متعادل ایجاد کرده است.

یکی از کارکنان سابق به نام بنجامین لیو گفت: «لیانگ به ما اختیار عمل می‌داد و ما را به‌عنوان متخصص می‌دید. او مدام سؤال می‌پرسید و همراه با ما یاد می‌گرفت.»

تمرکز بر کیفیت به‌جای رقابت تجاری

در حالی که شرکت‌های بزرگ چینی مانند بایدو در سال ۲۰۲۳ به‌دنبال توسعه نسخه‌های مشابه ChatGPT بودند، لیانگ از سرمایه‌گذاری سنگین در توسعه اپلیکیشن‌های مصرف‌کننده خودداری کرد و تمرکز خود را بر ارتقای کیفیت مدل‌های هوش مصنوعی گذاشت.

این رویکرد باعث شد DeepSeek به‌جای رقابت تجاری، بیشتر شبیه به آزمایشگاه تحقیقاتی عمل کند و درعین‌حال، به یکی از شرکت‌های پیشرو در حوزه هوش مصنوعی تبدیل شود.

چگونه DeepSeek با هزینه کمتر به موفقیت رسید؟

موفقیت DeepSeek به‌دلیل سرمایه‌گذاری چندین‌ساله High-Flyer در تحقیقات و قدرت محاسباتی بوده است. این شرکت در سال‌های ۲۰۲۰ و ۲۰۲۱ حدود ۱.۲ میلیارد یوان برای ساخت دو ابررایانه مجهز به حدود ۱۰,۰۰۰ تراشه Nvidia A100 هزینه کرد. این تراشه‌ها بعداً توسط ایالات متحده برای صادرات به چین ممنوع شدند؛ اما DeepSeek پیش‌از این ممنوعیت، به منابع کافی دسترسی پیدا کرده بود.

معماری هوش مصنوعی ارزان‌تر، اما قدرتمندتر

DeepSeek از تکنیک‌های Mixture-of-Experts (MoE) و Multihead Latent Attention (MLA) استفاده می‌کند که هزینه محاسباتی کمتری دارند.

MoE مدل هوش مصنوعی را به بخش‌های تخصصی تقسیم می‌کند و فقط بخش‌های مرتبط با درخواست را فعال می‌سازد، درحالی‌که معماری‌های دیگر تمام مدل را استفاده می‌کنند.

MLA به مدل امکان می‌دهد اطلاعات را به‌طور هم‌زمان از زوایای مختلف پردازش کند و جزئیات کلیدی را بهتر تشخیص دهد. این روش‌ها به DeepSeek کمک کردند تا با هزینه ۲۰ تا ۴۰ برابر کمتر از OpenAI، به نتایج مشابهی برسد.

استقبال چین و نگرانی غرب

موفقیت DeepSeek باعث شده است دولت چین آن را به‌عنوان نمادی از نوآوری ملی بپذیرد. تاکنون حداقل ۱۳ شهرداری و ۱۰ شرکت بزرگ دولتی در چین از مدل‌های این شرکت استفاده کرده‌اند. البته این در حالی است که کشورهایی مانند کره جنوبی و ایتالیا به دلایل امنیتی آن را از فروشگاه‌های نرم‌افزاری خود حذف کرده‌اند.

استفن وو، بنیان‌گذار صندوق پوشش ریسک Carthage Capital، گفت: «اگر DeepSeek به مدل پیش‌فرض هوش مصنوعی در سازمان‌های دولتی چین تبدیل شود، احتمال دارد محدودیت‌های بیشتری از سوی غرب بر تراشه‌ها یا همکاری‌های نرم‌افزاری اعمال شود.»

چشم‌انداز آینده

موفقیت DeepSeek، به‌ویژه با استفاده از مدل‌های مقرون‌به‌صرفه، می‌تواند توازن قوا در صنعت هوش مصنوعی را تغییر دهد. این شرکت در حالی به‌سرعت در حال پیشرفت است که رقبای غربی مجبور به کاهش قیمت‌ها و تغییر استراتژی‌های خود شده‌اند.

آیا DeepSeek می‌تواند در رقابت با غول‌های فناوری غربی پیروز شود و چین را به رهبر جدید هوش مصنوعی تبدیل کند؟ زمان پاسخ این سوال را خواهد داد.

سوالات متداول این بخش
نظرات کاربران

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

مقالات مشابه
قابلیت حافظه در Gemini؛ گوگل هوش مصنوعی خود را هوشمندتر کرد
گوگل بالاخره یکی از مهم‌ترین ویژگی‌های مورد انتظار کاربران را به Gemini اضا…
تیم تحریریه ( ۱ امتیاز )
ممنوعیت موقت دانلود DeepSeek در کره جنوبی به‌دلیل نگرانی‌های حریم خصوصی
مقامات کره جنوبی، دسترسی به اپلیکیشن چینی DeepSeek را به‌دلیل مشکلات مرتبط…
تیم تحریریه ( ۱ امتیاز )
مایکروسافت در رقابت با OpenAI سرعت خود را افزایش می‌دهد
مایکروسافت برای کاهش وابستگی به OpenAI و افزایش قدرت رقابتی خود، مشغول توسع…
تیم تحریریه ( ۰ امتیاز )