استارتاپ چینی DeepSeek قصد دارد از فرصت پیشآمده نهایت استفاده را ببرد. این شرکت ماه گذشته با معرفی یک مدل هوش مصنوعی ارزانقیمت، باعث سقوط بیشاز یک تریلیون دلاری بازارهای سهام جهانی شد. این مدل از نظر قدرت استدلال از بسیاری از رقبای غربی بهتر عمل کرد.
DeepSeek که در هانگژو مستقر است، در حال سرعت بخشیدن به عرضه مدل جانشین R1 است که در ژانویه معرفی شد. به گفته سه منبع آگاه، این شرکت قصد داشت R2 را در اوایل ماه می عرضه کند؛ اما حالا تصمیم دارد هرچه زودتر آن را روانه بازار کند. هدف از عرضه R2 بهبود توانایی کدنویسی و ارتقای قابلیت استدلال در زبانهایی بهجز انگلیسی است. این تصمیم در حالی گرفته شده که جزئیات مربوط به زمان دقیق عرضه هنوز بهطور رسمی اعلام نشده است.
چالش جدید برای غولهای هوش مصنوعی غربی

مدل R1 با استفاده از تراشههای ضعیفتر Nvidia ساخته شده؛ اما توانسته است با مدلهایی که با هزینه صدها میلیارد دلار توسط غولهای فناوری آمریکا تولید شدهاند، رقابت کند.
“ویجایاسیمها آلیلوقاتا، مدیر عملیاتی شرکت فناوری Zensar هند، معتقد است: «عرضه R2 میتواند لحظهای تعیینکننده در صنعت هوش مصنوعی باشد.» او افزود: «موفقیت DeepSeek در تولید مدلهای مقرونبهصرفه احتمالاً باعث تسریع تلاشهای جهانی و شکستن انحصار چند شرکت بزرگ در این حوزه خواهد شد.»
نگرانی ایالات متحده از پیشرفت DeepSeek
موفقیت این مدل ممکن است نگرانی دولت ایالات متحده را افزایش دهد؛ زیرا رهبری در حوزه هوش مصنوعی را یک اولویت ملی میداند. این در حالی است که شرکتهای چینی، از جمله دهها شرکتی که از مدلهای DeepSeek استفاده میکنند، با سرعت زیادی در حال پیشرفت هستند.
موسس مرموز و سبک مدیریتی متفاوت
کمتر کسی در مورد DeepSeek و موسس آن، لیانگ ونفنگ، که از طریق صندوق پوشش ریسک High-Flyer به میلیاردها دلار دست یافت، اطلاعات دارد. او که بهعنوان فردی «کمحرف و درونگرا» شناخته میشود، از جولای ۲۰۲۴ با هیچ رسانهای مصاحبه نکرده است.
سبک مدیریتی لیانگ در DeepSeek و High-Flyer متفاوت از سنتهای سختگیرانه صنعت فناوری چین است. او از ساختارهای سلسلهمراتبی و ساعات کاری فشرده (۹ صبح تا ۹ شب، شش روز در هفته) دوری کرده و محیطی مشارکتی با ساعات کاری متعادل ایجاد کرده است.
یکی از کارکنان سابق به نام بنجامین لیو گفت: «لیانگ به ما اختیار عمل میداد و ما را بهعنوان متخصص میدید. او مدام سؤال میپرسید و همراه با ما یاد میگرفت.»
تمرکز بر کیفیت بهجای رقابت تجاری
در حالی که شرکتهای بزرگ چینی مانند بایدو در سال ۲۰۲۳ بهدنبال توسعه نسخههای مشابه ChatGPT بودند، لیانگ از سرمایهگذاری سنگین در توسعه اپلیکیشنهای مصرفکننده خودداری کرد و تمرکز خود را بر ارتقای کیفیت مدلهای هوش مصنوعی گذاشت.
این رویکرد باعث شد DeepSeek بهجای رقابت تجاری، بیشتر شبیه به آزمایشگاه تحقیقاتی عمل کند و درعینحال، به یکی از شرکتهای پیشرو در حوزه هوش مصنوعی تبدیل شود.
چگونه DeepSeek با هزینه کمتر به موفقیت رسید؟
موفقیت DeepSeek بهدلیل سرمایهگذاری چندینساله High-Flyer در تحقیقات و قدرت محاسباتی بوده است. این شرکت در سالهای ۲۰۲۰ و ۲۰۲۱ حدود ۱.۲ میلیارد یوان برای ساخت دو ابررایانه مجهز به حدود ۱۰,۰۰۰ تراشه Nvidia A100 هزینه کرد. این تراشهها بعداً توسط ایالات متحده برای صادرات به چین ممنوع شدند؛ اما DeepSeek پیشاز این ممنوعیت، به منابع کافی دسترسی پیدا کرده بود.
معماری هوش مصنوعی ارزانتر، اما قدرتمندتر
DeepSeek از تکنیکهای Mixture-of-Experts (MoE) و Multihead Latent Attention (MLA) استفاده میکند که هزینه محاسباتی کمتری دارند.
MoE مدل هوش مصنوعی را به بخشهای تخصصی تقسیم میکند و فقط بخشهای مرتبط با درخواست را فعال میسازد، درحالیکه معماریهای دیگر تمام مدل را استفاده میکنند.
MLA به مدل امکان میدهد اطلاعات را بهطور همزمان از زوایای مختلف پردازش کند و جزئیات کلیدی را بهتر تشخیص دهد. این روشها به DeepSeek کمک کردند تا با هزینه ۲۰ تا ۴۰ برابر کمتر از OpenAI، به نتایج مشابهی برسد.
استقبال چین و نگرانی غرب
موفقیت DeepSeek باعث شده است دولت چین آن را بهعنوان نمادی از نوآوری ملی بپذیرد. تاکنون حداقل ۱۳ شهرداری و ۱۰ شرکت بزرگ دولتی در چین از مدلهای این شرکت استفاده کردهاند. البته این در حالی است که کشورهایی مانند کره جنوبی و ایتالیا به دلایل امنیتی آن را از فروشگاههای نرمافزاری خود حذف کردهاند.
استفن وو، بنیانگذار صندوق پوشش ریسک Carthage Capital، گفت: «اگر DeepSeek به مدل پیشفرض هوش مصنوعی در سازمانهای دولتی چین تبدیل شود، احتمال دارد محدودیتهای بیشتری از سوی غرب بر تراشهها یا همکاریهای نرمافزاری اعمال شود.»
چشمانداز آینده
موفقیت DeepSeek، بهویژه با استفاده از مدلهای مقرونبهصرفه، میتواند توازن قوا در صنعت هوش مصنوعی را تغییر دهد. این شرکت در حالی بهسرعت در حال پیشرفت است که رقبای غربی مجبور به کاهش قیمتها و تغییر استراتژیهای خود شدهاند.
آیا DeepSeek میتواند در رقابت با غولهای فناوری غربی پیروز شود و چین را به رهبر جدید هوش مصنوعی تبدیل کند؟ زمان پاسخ این سوال را خواهد داد.
مقاله بسیار جالبی در مورد DeepSeek و مدل هوش مصنوعی آن بود. از توضیحات شما در مورد تفاوتهایی که DeepSeek نسبت به سایر شرکتهای غربی و چینی دارد بسیار لذت بردم. بهنظرم استفاده از تکنیکهای Mixture-of-Experts و Multihead Latent Attention یکی از دلایل کلیدی موفقیت این استارتاپ است. آیا اطلاعات بیشتری دربارهی نحوه عملکرد این تکنیکها و تاثیر آنها در کاهش هزینهها دارید؟ قطعاً دانستن تجربیات یا دیدگاه شما میتواند برای علاقهمندان به زمینه هوش مصنوعی مفید باشد. امیدوارم در آینده مطالب بیشتری در مورد این نوآوریها ببینیم!
به عنوان کسی که علاقهی زیادی به حوزه استارتاپ و تکنولوژی دارم، خواندن این مطلب برایم بسیار آموزنده بود. واقعاً تعجبآور است که DeepSeek توانسته با هزینههای کمتر به موفقیتهای بزرگی دست یابد. آیا فکر میکنید این شرکت میتواند در آینده نزدیک با غولهای غربی همچون OpenAI رقابت کند؟ استفاده از مدلهای مقرونبهصرفه واقعاً تاثیر چشمگیری داشته است و امیدوارم بتواند به تعادل و برابری بیشتری در بازار هوش مصنوعی کمک کند. خوشحال میشوم نظر نویسنده در این باره بیشتر بدانم.
سلام و درود به تیم تحریریه! معرفی DeepSeek واقعاً جذاب بود و نشاندهنده قدرت نوآوری در چین است. اینکه این شرکت توانسته با ساختار کاری متفاوت و سبک مدیریتی خاص به نتایج بزرگی دست یابد واقعا قابل تحسین است. به نظر شما آیا موفقیتهای DeepSeek ممکن است باعث تغییر نگرش سایر شرکتها به مدلهای مدیریتی و ساختار سازمانی شود؟ دوست دارم دربارهی تاثیرات این دستاوردها بر وضعیت نیروی کار در شرکتهای تکنولوژی بیشتر بدانم. ممنون از اطلاعات بهروز و جذابتان.
مقاله فوقالعاده آموزندهای بود! خیلی متعجب شدم که DeepSeek توانسته با استفاده از تراشههای ضعیفتر Nvidia همچنان با مدلهای پرهزینهتر شرکتهای غربی رقابت کند. آیا در محاسبات و تکنیکهای مورد استفادهی DeepSeek برخلاف سایرین، تفاوتهای خاصی وجود دارد؟ و اینکه این امکان وجود دارد که با حفظ هزینههای پایین همچنان در این رقابت جهانی جلو بمانند؟ دوست دارم دربارهی راهکارهای فنی و چگونگی دستیابی به این موفقیتها بیشتر بدانم. سپاس فراوان از گزارش کامل و دقیق شما.
من که خیلی سر در نمیارم از این چیزا، ولی شنیدم چین توی هوش مصنوعی خیلی پیشرفت کرده. دیده بودم توی تلویزیون که شرکتهای زیادی دارن مدلهای ارزونتر میسازن و دیگه نیازی نیست کلی پول خرج کنیم. آیا این مدلهای DeepSeek توی کشورای دیگه هم استفاده میشن یا فقط توی چین محبوبه؟ شنیدن این چیزها واسه آدمای عادی مثل من خیلی جالبه و اگه بیشتر هم اطلاعات بدید حتماً استفاده میکنم. ممنون از توضیحات و زمانی که گذاشتید.
بهعنوان کسی که تازه به دنیای تکنولوژی و استارتاپها علاقهمند شدهام، این مقاله برایم الهامبخش بود. متوجه شدم که DeepSeek راه جدیدی در پیش گرفته و از هزینههای سنگین جلوگیری کرده. آیا شرکتهای دیگر هم به این سبک کار میکنند یا هنوز به روشهای قدیمی پایبند هستند؟ و اینکه چه نوع حمایتهایی از سوی دولت چین صورت گرفته؟ امیدوارم با اطلاعات بیشتری درباره نوآوریهای مشابه در سایر شرکتهای چینی آشنا شوم. از مقالهتون واقعاً لذت بردم، دست شما درد نکنه.
سلام و خسته نباشید به نویسنده محترم این مقاله. اگر بگم از این مطلب خیلی یاد گرفتم کم گفتن! خیلی برام جالب بود که DeepSeek تونسته با منابع محدود به نتایج بزرگی دست پیدا کنه. این سبک مدیریتی که دارن، مثل تعامل مستقیم با کارمندان و کاهش ساعات کار، آیا توی شرکتهای دیگه هم داره اجرا میشه؟ آیا این سبک مدیریتی موثر هست؟ خیلی دوست دارم بدونم که چطور میشه این روشها رو در جاهای دیگه هم عملی کرد. واقعا عالی بود!
مطالبی که در این مقاله دربارهی DeepSeek گفته شد خیلی توجهام رو جلب کرد. خیلی دوست دارم بدونم که در حال حاضر دولتها و شرکتهای خارجی چطور با این نوآوریها برخورد میکنن؟ آیا این موفقیت باعث مقابله و رقابت شدیدتر میشه؟ احساس میکنم که ظهور DeepSeek میتونه صنعت هوش مصنوعی رو به چالش بکشه و دوباره تعریف کنه. آیا شما فکر میکنید این تغییرات میتونه به بهبود دسترسی عمومی به تکنولوژیهای پیشرفتهی هوش مصنوعی منجر بشه؟ ممنون میشم دربارهی این موضوع بیشتر بدونم.
سلام و وقت بخیر! مقاله پر از اطلاعات جدیدی بود برای من که خیلی به هوش مصنوعی علاقه دارم ولی سررشته زیادی ندارم. اینکه DeepSeek تونسته با تراشههای ضعیفتر و هزینه کمتر به موفقیت دست پیدا کنه خیلی جالبه. این تراشهها که میگن ممنوع شده بود توسط آمریکا، آیا تاثیری روی کار این شرکت گذاشته؟ و چطور این همه تکنولوژی پیشرفته رو با هزینه کمتر ساختن؟ خیلی علاقهمندم بدونم که آیا این راهکارها رو میشه تو شرکتهای دیگه هم استفاده کرد یا نه. ممنون از اطلاعات خفنتون.
چقدر خوب بود که اینجا دربارهی DeepSeek اطلاعات گرفتم، خیلی تعریفش رو شنیده بودم و خوشحالم که جزییات بیشتری دونستم. میخواستم بدونم که آیا این مدلهایی که گفتید توی کشورای دیگه هم عرضه میشن؟ توی کشورای غربی چطور از این تکنولوژی استفاده میشه؟ اینکه منابعشون قبل از تحریمها آماده شده واقعا عاقلانه بوده. همچنین خیلی جالب بود بدونم که استفاده از چه تکنیکهایی باعث شده اینقدر هزینهها رو کاهش بده. خیلی خوشحال میشم پاسخهاتون رو بخونم. سپاس از مقاله خوبتون.