استارتاپ چینی DeepSeek قصد دارد از فرصت پیشآمده نهایت استفاده را ببرد. این شرکت ماه گذشته با معرفی یک مدل هوش مصنوعی ارزانقیمت، باعث سقوط بیشاز یک تریلیون دلاری بازارهای سهام جهانی شد. این مدل از نظر قدرت استدلال از بسیاری از رقبای غربی بهتر عمل کرد.
DeepSeek که در هانگژو مستقر است، در حال سرعت بخشیدن به عرضه مدل جانشین R1 است که در ژانویه معرفی شد. به گفته سه منبع آگاه، این شرکت قصد داشت R2 را در اوایل ماه می عرضه کند؛ اما حالا تصمیم دارد هرچه زودتر آن را روانه بازار کند. هدف از عرضه R2 بهبود توانایی کدنویسی و ارتقای قابلیت استدلال در زبانهایی بهجز انگلیسی است. این تصمیم در حالی گرفته شده که جزئیات مربوط به زمان دقیق عرضه هنوز بهطور رسمی اعلام نشده است.
چالش جدید برای غولهای هوش مصنوعی غربی

مدل R1 با استفاده از تراشههای ضعیفتر Nvidia ساخته شده؛ اما توانسته است با مدلهایی که با هزینه صدها میلیارد دلار توسط غولهای فناوری آمریکا تولید شدهاند، رقابت کند.
“ویجایاسیمها آلیلوقاتا، مدیر عملیاتی شرکت فناوری Zensar هند، معتقد است: «عرضه R2 میتواند لحظهای تعیینکننده در صنعت هوش مصنوعی باشد.» او افزود: «موفقیت DeepSeek در تولید مدلهای مقرونبهصرفه احتمالاً باعث تسریع تلاشهای جهانی و شکستن انحصار چند شرکت بزرگ در این حوزه خواهد شد.»
نگرانی ایالات متحده از پیشرفت DeepSeek
موفقیت این مدل ممکن است نگرانی دولت ایالات متحده را افزایش دهد؛ زیرا رهبری در حوزه هوش مصنوعی را یک اولویت ملی میداند. این در حالی است که شرکتهای چینی، از جمله دهها شرکتی که از مدلهای DeepSeek استفاده میکنند، با سرعت زیادی در حال پیشرفت هستند.
موسس مرموز و سبک مدیریتی متفاوت
کمتر کسی در مورد DeepSeek و موسس آن، لیانگ ونفنگ، که از طریق صندوق پوشش ریسک High-Flyer به میلیاردها دلار دست یافت، اطلاعات دارد. او که بهعنوان فردی «کمحرف و درونگرا» شناخته میشود، از جولای ۲۰۲۴ با هیچ رسانهای مصاحبه نکرده است.
سبک مدیریتی لیانگ در DeepSeek و High-Flyer متفاوت از سنتهای سختگیرانه صنعت فناوری چین است. او از ساختارهای سلسلهمراتبی و ساعات کاری فشرده (۹ صبح تا ۹ شب، شش روز در هفته) دوری کرده و محیطی مشارکتی با ساعات کاری متعادل ایجاد کرده است.
یکی از کارکنان سابق به نام بنجامین لیو گفت: «لیانگ به ما اختیار عمل میداد و ما را بهعنوان متخصص میدید. او مدام سؤال میپرسید و همراه با ما یاد میگرفت.»
تمرکز بر کیفیت بهجای رقابت تجاری
در حالی که شرکتهای بزرگ چینی مانند بایدو در سال ۲۰۲۳ بهدنبال توسعه نسخههای مشابه ChatGPT بودند، لیانگ از سرمایهگذاری سنگین در توسعه اپلیکیشنهای مصرفکننده خودداری کرد و تمرکز خود را بر ارتقای کیفیت مدلهای هوش مصنوعی گذاشت.
این رویکرد باعث شد DeepSeek بهجای رقابت تجاری، بیشتر شبیه به آزمایشگاه تحقیقاتی عمل کند و درعینحال، به یکی از شرکتهای پیشرو در حوزه هوش مصنوعی تبدیل شود.
چگونه DeepSeek با هزینه کمتر به موفقیت رسید؟
موفقیت DeepSeek بهدلیل سرمایهگذاری چندینساله High-Flyer در تحقیقات و قدرت محاسباتی بوده است. این شرکت در سالهای ۲۰۲۰ و ۲۰۲۱ حدود ۱.۲ میلیارد یوان برای ساخت دو ابررایانه مجهز به حدود ۱۰,۰۰۰ تراشه Nvidia A100 هزینه کرد. این تراشهها بعداً توسط ایالات متحده برای صادرات به چین ممنوع شدند؛ اما DeepSeek پیشاز این ممنوعیت، به منابع کافی دسترسی پیدا کرده بود.
معماری هوش مصنوعی ارزانتر، اما قدرتمندتر
DeepSeek از تکنیکهای Mixture-of-Experts (MoE) و Multihead Latent Attention (MLA) استفاده میکند که هزینه محاسباتی کمتری دارند.
MoE مدل هوش مصنوعی را به بخشهای تخصصی تقسیم میکند و فقط بخشهای مرتبط با درخواست را فعال میسازد، درحالیکه معماریهای دیگر تمام مدل را استفاده میکنند.
MLA به مدل امکان میدهد اطلاعات را بهطور همزمان از زوایای مختلف پردازش کند و جزئیات کلیدی را بهتر تشخیص دهد. این روشها به DeepSeek کمک کردند تا با هزینه ۲۰ تا ۴۰ برابر کمتر از OpenAI، به نتایج مشابهی برسد.
استقبال چین و نگرانی غرب
موفقیت DeepSeek باعث شده است دولت چین آن را بهعنوان نمادی از نوآوری ملی بپذیرد. تاکنون حداقل ۱۳ شهرداری و ۱۰ شرکت بزرگ دولتی در چین از مدلهای این شرکت استفاده کردهاند. البته این در حالی است که کشورهایی مانند کره جنوبی و ایتالیا به دلایل امنیتی آن را از فروشگاههای نرمافزاری خود حذف کردهاند.
استفن وو، بنیانگذار صندوق پوشش ریسک Carthage Capital، گفت: «اگر DeepSeek به مدل پیشفرض هوش مصنوعی در سازمانهای دولتی چین تبدیل شود، احتمال دارد محدودیتهای بیشتری از سوی غرب بر تراشهها یا همکاریهای نرمافزاری اعمال شود.»
چشمانداز آینده
موفقیت DeepSeek، بهویژه با استفاده از مدلهای مقرونبهصرفه، میتواند توازن قوا در صنعت هوش مصنوعی را تغییر دهد. این شرکت در حالی بهسرعت در حال پیشرفت است که رقبای غربی مجبور به کاهش قیمتها و تغییر استراتژیهای خود شدهاند.
آیا DeepSeek میتواند در رقابت با غولهای فناوری غربی پیروز شود و چین را به رهبر جدید هوش مصنوعی تبدیل کند؟ زمان پاسخ این سوال را خواهد داد.