یورش DeepSeek برای عرضه مدل جدید هوش مصنوعی در رقابت با غرب

آخرین به‌روزرسانی: 13 مرداد 1404, 2:26 ب.ظ

رضا باقری 06 اسفند 1403 اخبار و رویداد ۵ دقیقه زمان مطالعه 10 دیدگاه ( ۳ امتیاز )

استارتاپ چینی DeepSeek قصد دارد از فرصت پیش‌آمده نهایت استفاده را ببرد. این شرکت ماه گذشته با معرفی یک مدل هوش مصنوعی ارزان‌قیمت، باعث سقوط بیش‌از یک تریلیون دلاری بازارهای سهام جهانی شد. این مدل از نظر قدرت استدلال از بسیاری از رقبای غربی بهتر عمل کرد.

DeepSeek که در هانگژو مستقر است، در حال سرعت بخشیدن به عرضه مدل جانشین R1 است که در ژانویه معرفی شد. به گفته سه منبع آگاه، این شرکت قصد داشت R2 را در اوایل ماه می عرضه کند؛ اما حالا تصمیم دارد هرچه زودتر آن را روانه بازار کند. هدف از عرضه R2 بهبود توانایی کدنویسی و ارتقای قابلیت استدلال در زبان‌هایی به‌جز انگلیسی است. این تصمیم در حالی گرفته شده که جزئیات مربوط به زمان دقیق عرضه هنوز به‌طور رسمی اعلام نشده است.

چالش جدید برای غول‌های هوش مصنوعی غربی

یورش DeepSeek برای عرضه مدل جدید هوش مصنوعی در رقابت با غرب

مدل R1 با استفاده از تراشه‌های ضعیف‌تر Nvidia ساخته شده؛ اما توانسته است با مدل‌هایی که با هزینه صدها میلیارد دلار توسط غول‌های فناوری آمریکا تولید شده‌اند، رقابت کند.

“ویجایاسیمها آلیلوقاتا، مدیر عملیاتی شرکت فناوری Zensar هند، معتقد است: «عرضه R2 می‌تواند لحظه‌ای تعیین‌کننده در صنعت هوش مصنوعی باشد.» او افزود: «موفقیت DeepSeek در تولید مدل‌های مقرون‌به‌صرفه احتمالاً باعث تسریع تلاش‌های جهانی و شکستن انحصار چند شرکت بزرگ در این حوزه خواهد شد.»

نگرانی ایالات متحده از پیشرفت DeepSeek

موفقیت این مدل ممکن است نگرانی دولت ایالات متحده را افزایش دهد؛ زیرا رهبری در حوزه هوش مصنوعی را یک اولویت ملی می‌داند. این در حالی است که شرکت‌های چینی، از جمله ده‌ها شرکتی که از مدل‌های هوش مصنوعی DeepSeek استفاده می‌کنند، با سرعت زیادی در حال پیشرفت هستند.

موسس مرموز و سبک مدیریتی متفاوت

کمتر کسی در مورد DeepSeek و موسس آن، لیانگ ونفنگ، که از طریق صندوق پوشش ریسک High-Flyer به میلیاردها دلار دست یافت، اطلاعات دارد. او که به‌عنوان فردی «کم‌حرف و درون‌گرا» شناخته می‌شود، از جولای ۲۰۲۴ با هیچ رسانه‌ای مصاحبه نکرده است.

سبک مدیریتی لیانگ در DeepSeek و High-Flyer متفاوت از سنت‌های سخت‌گیرانه صنعت فناوری چین است. او از ساختارهای سلسله‌مراتبی و ساعات کاری فشرده (۹ صبح تا ۹ شب، شش روز در هفته) دوری کرده و محیطی مشارکتی با ساعات کاری متعادل ایجاد کرده است.

یکی از کارکنان سابق به نام بنجامین لیو گفت: «لیانگ به ما اختیار عمل می‌داد و ما را به‌عنوان متخصص می‌دید. او مدام سؤال می‌پرسید و همراه با ما یاد می‌گرفت.»

تمرکز بر کیفیت به‌جای رقابت تجاری

در حالی که شرکت‌های بزرگ چینی مانند بایدو در سال ۲۰۲۳ به‌دنبال توسعه نسخه‌های مشابه چت جی پی تی بودند، لیانگ از سرمایه‌گذاری سنگین در توسعه اپلیکیشن‌های مصرف‌کننده خودداری کرد و تمرکز خود را بر ارتقای کیفیت مدل‌های هوش مصنوعی گذاشت.

این رویکرد باعث شد DeepSeek به‌جای رقابت تجاری، بیشتر شبیه به آزمایشگاه تحقیقاتی عمل کند و درعین‌حال، به یکی از شرکت‌های پیشرو در حوزه هوش مصنوعی تبدیل شود.

چگونه DeepSeek با هزینه کمتر به موفقیت رسید؟

موفقیت DeepSeek به‌دلیل سرمایه‌گذاری چندین‌ساله High-Flyer در تحقیقات و قدرت محاسباتی بوده است. این شرکت در سال‌های ۲۰۲۰ و ۲۰۲۱ حدود ۱.۲ میلیارد یوان برای ساخت دو ابررایانه مجهز به حدود ۱۰,۰۰۰ تراشه Nvidia A100 هزینه کرد. این تراشه‌ها بعداً توسط ایالات متحده برای صادرات به چین ممنوع شدند؛ اما DeepSeek پیش‌از این ممنوعیت، به منابع کافی دسترسی پیدا کرده بود.

معماری هوش مصنوعی ارزان‌تر، اما قدرتمندتر

DeepSeek از تکنیک‌های Mixture-of-Experts (MoE) و Multihead Latent Attention (MLA) استفاده می‌کند که هزینه محاسباتی کمتری دارند.

MoE مدل هوش مصنوعی را به بخش‌های تخصصی تقسیم می‌کند و فقط بخش‌های مرتبط با درخواست را فعال می‌سازد، درحالی‌که معماری‌های دیگر تمام مدل را استفاده می‌کنند.

MLA به مدل امکان می‌دهد اطلاعات را به‌طور هم‌زمان از زوایای مختلف پردازش کند و جزئیات کلیدی را بهتر تشخیص دهد. این روش‌ها به DeepSeek کمک کردند تا با هزینه ۲۰ تا ۴۰ برابر کمتر از OpenAI، به نتایج مشابهی برسد.

استقبال چین و نگرانی غرب

موفقیت DeepSeek باعث شده است دولت چین آن را به‌عنوان نمادی از نوآوری ملی بپذیرد. تاکنون حداقل ۱۳ شهرداری و ۱۰ شرکت بزرگ دولتی در چین از مدل‌های این شرکت استفاده کرده‌اند. البته این در حالی است که کشورهایی مانند کره جنوبی و ایتالیا به دلایل امنیتی آن را از فروشگاه‌های نرم‌افزاری خود حذف کرده‌اند.

استفن وو، بنیان‌گذار صندوق پوشش ریسک Carthage Capital، گفت: «اگر DeepSeek به مدل پیش‌فرض هوش مصنوعی در سازمان‌های دولتی چین تبدیل شود، احتمال دارد محدودیت‌های بیشتری از سوی غرب بر تراشه‌ها یا همکاری‌های نرم‌افزاری اعمال شود.»

چشم‌انداز آینده

موفقیت DeepSeek، به‌ویژه با استفاده از مدل‌های مقرون‌به‌صرفه، می‌تواند توازن قوا در صنعت هوش مصنوعی را تغییر دهد. این شرکت در حالی به‌سرعت در حال پیشرفت است که رقبای غربی مجبور به کاهش قیمت‌ها و تغییر استراتژی‌های خود شده‌اند.

آیا DeepSeek می‌تواند در رقابت با غول‌های فناوری غربی پیروز شود و چین را به رهبر جدید هوش مصنوعی تبدیل کند؟ زمان پاسخ این سوال را خواهد داد.

سوالات متداول این بخش

نظرات کاربران

10 پاسخ به “یورش DeepSeek برای عرضه مدل جدید هوش مصنوعی در رقابت با غرب”

سهیلا معتمدی گفت:

فروردین 17, 1404 در 1:17 ب.ظ

مقاله بسیار جالبی در مورد DeepSeek و مدل‌ هوش مصنوعی آن بود. از توضیحات شما در مورد تفاوت‌هایی که DeepSeek نسبت به سایر شرکت‌های غربی و چینی دارد بسیار لذت بردم. به‌نظرم استفاده از تکنیک‌های Mixture-of-Experts و Multihead Latent Attention یکی از دلایل کلیدی موفقیت این استارتاپ است. آیا اطلاعات بیشتری درباره‌ی نحوه عملکرد این تکنیک‌ها و تاثیر آن‌ها در کاهش هزینه‌ها دارید؟ قطعاً دانستن تجربیات یا دیدگاه شما می‌تواند برای علاقه‌مندان به زمینه هوش مصنوعی مفید باشد. امیدوارم در آینده مطالب بیشتری در مورد این نوآوری‌ها ببینیم!

پاسخ
بابک فلاحی گفت:

فروردین 17, 1404 در 1:17 ب.ظ

به عنوان کسی که علاقه‌ی زیادی به حوزه استارتاپ و تکنولوژی دارم، خواندن این مطلب برایم بسیار آموزنده بود. واقعاً تعجب‌آور است که DeepSeek توانسته با هزینه‌های کمتر به موفقیت‌های بزرگی دست یابد. آیا فکر می‌کنید این شرکت می‌تواند در آینده نزدیک با غول‌های غربی همچون OpenAI رقابت کند؟ استفاده از مدل‌های مقرون‌به‌صرفه واقعاً تاثیر چشمگیری داشته است و امیدوارم بتواند به تعادل و برابری بیشتری در بازار هوش مصنوعی کمک کند. خوشحال می‌شوم نظر نویسنده در این باره بیشتر بدانم.

پاسخ
البرز نوری گفت:

فروردین 17, 1404 در 1:17 ب.ظ

سلام و درود به تیم تحریریه! معرفی DeepSeek واقعاً جذاب بود و نشان‌دهنده قدرت نوآوری در چین است. اینکه این شرکت توانسته با ساختار کاری متفاوت و سبک مدیریتی خاص به نتایج بزرگی دست یابد واقعا قابل تحسین است. به نظر شما آیا موفقیت‌های DeepSeek ممکن است باعث تغییر نگرش سایر شرکت‌ها به مدل‌های مدیریتی و ساختار سازمانی شود؟ دوست دارم درباره‌ی تاثیرات این دستاوردها بر وضعیت نیروی کار در شرکت‌های تکنولوژی بیشتر بدانم. ممنون از اطلاعات به‌روز و جذابتان.

پاسخ
مهراد ابراهیمی گفت:

فروردین 17, 1404 در 1:17 ب.ظ

مقاله فوق‌العاده آموزنده‌ای بود! خیلی متعجب شدم که DeepSeek توانسته با استفاده از تراشه‌های ضعیف‌تر Nvidia همچنان با مدل‌های پرهزینه‌تر شرکت‌های غربی رقابت کند. آیا در محاسبات و تکنیک‌های مورد استفاده‌ی DeepSeek برخلاف سایرین، تفاوت‌های خاصی وجود دارد؟ و اینکه این امکان وجود دارد که با حفظ هزینه‌های پایین همچنان در این رقابت جهانی جلو بمانند؟ دوست دارم درباره‌ی راهکارهای فنی و چگونگی دست‌یابی به این موفقیت‌ها بیشتر بدانم. سپاس فراوان از گزارش کامل و دقیق شما.

پاسخ
سهیلا حسامی گفت:

فروردین 17, 1404 در 1:17 ب.ظ

من که خیلی سر در نمیارم از این چیزا، ولی شنیدم چین توی هوش مصنوعی خیلی پیشرفت کرده. دیده بودم توی تلویزیون که شرکت‌های زیادی دارن مدل‌های ارزون‌تر می‌سازن و دیگه نیازی نیست کلی پول خرج کنیم. آیا این مدل‌های DeepSeek توی کشورای دیگه هم استفاده می‌شن یا فقط توی چین محبوبه؟ شنیدن این چیزها واسه آدمای عادی مثل من خیلی جالبه و اگه بیشتر هم اطلاعات بدید حتماً استفاده می‌کنم. ممنون از توضیحات و زمانی که گذاشتید.

پاسخ
ثریا عسگری گفت:

فروردین 17, 1404 در 1:17 ب.ظ

به‌عنوان کسی که تازه به دنیای تکنولوژی و استارتاپ‌ها علاقه‌مند شده‌ام، این مقاله برایم الهام‌بخش بود. متوجه شدم که DeepSeek راه جدیدی در پیش گرفته و از هزینه‌های سنگین جلوگیری کرده. آیا شرکت‌های دیگر هم به این سبک کار می‌کنند یا هنوز به روش‌های قدیمی پایبند هستند؟ و اینکه چه نوع حمایت‌هایی از سوی دولت چین صورت گرفته؟ امیدوارم با اطلاعات بیشتری درباره نوآوری‌های مشابه در سایر شرکت‌های چینی آشنا شوم. از مقاله‌تون واقعاً لذت بردم، دست شما درد نکنه.

پاسخ
کامران طاهری گفت:

فروردین 17, 1404 در 1:17 ب.ظ

سلام و خسته نباشید به نویسنده محترم این مقاله. اگر بگم از این مطلب خیلی یاد گرفتم کم گفتن! خیلی برام جالب بود که DeepSeek تونسته با منابع محدود به نتایج بزرگی دست پیدا کنه. این سبک مدیریتی که دارن، مثل تعامل مستقیم با کارمندان و کاهش ساعات کار، آیا توی شرکت‌های دیگه هم داره اجرا می‌شه؟ آیا این سبک مدیریتی موثر هست؟ خیلی دوست دارم بدونم که چطور میشه این روش‌ها رو در جاهای دیگه هم عملی کرد. واقعا عالی بود!

پاسخ
انسیه پژمان‌فر گفت:

فروردین 17, 1404 در 1:17 ب.ظ

مطالبی که در این مقاله درباره‌ی DeepSeek گفته شد خیلی توجه‌ام رو جلب کرد. خیلی دوست دارم بدونم که در حال حاضر دولت‌ها و شرکت‌های خارجی چطور با این نوآوری‌ها برخورد می‌کنن؟ آیا این موفقیت باعث مقابله و رقابت شدیدتر می‌شه؟ احساس می‌کنم که ظهور DeepSeek می‌تونه صنعت هوش مصنوعی رو به چالش بکشه و دوباره تعریف کنه. آیا شما فکر می‌کنید این تغییرات می‌تونه به بهبود دسترسی عمومی به تکنولوژی‌های پیشرفته‌ی هوش مصنوعی منجر بشه؟ ممنون میشم درباره‌ی این موضوع بیشتر بدونم.

پاسخ
آریانا محسنی گفت:

فروردین 17, 1404 در 1:17 ب.ظ

سلام و وقت بخیر! مقاله پر از اطلاعات جدیدی بود برای من که خیلی به هوش مصنوعی علاقه دارم ولی سررشته زیادی ندارم. اینکه DeepSeek تونسته با تراشه‌های ضعیف‌تر و هزینه کمتر به موفقیت دست پیدا کنه خیلی جالبه. این تراشه‌ها که می‌گن ممنوع شده بود توسط آمریکا، آیا تاثیری روی کار این شرکت گذاشته؟ و چطور این همه تکنولوژی پیشرفته رو با هزینه کمتر ساختن؟ خیلی علاقه‌مندم بدونم که آیا این راهکارها رو میشه تو شرکت‌های دیگه هم استفاده کرد یا نه. ممنون از اطلاعات خفنتون.

پاسخ
شهلا فولادوند گفت:

فروردین 17, 1404 در 1:17 ب.ظ

چقدر خوب بود که اینجا درباره‌ی DeepSeek اطلاعات گرفتم، خیلی تعریفش رو شنیده بودم و خوشحالم که جزییات بیشتری دونستم. می‌خواستم بدونم که آیا این مدل‌هایی که گفتید توی کشورای دیگه هم عرضه می‌شن؟ توی کشورای غربی چطور از این تکنولوژی استفاده می‌شه؟ اینکه منابعشون قبل از تحریم‌ها آماده شده واقعا عاقلانه بوده. همچنین خیلی جالب بود بدونم که استفاده از چه تکنیک‌هایی باعث شده اینقدر هزینه‌ها رو کاهش بده. خیلی خوشحال می‌شم پاسخ‌هاتون رو بخونم. سپاس از مقاله خوبتون.

پاسخ

دیدگاهتان را بنویسید لغو پاسخ

مقالات مشابه

گوگل کلود در کنفرانس Next از همکاری با استارتاپ‌های برجسته هوش مصنوعی خبر داد

شرکت گوگل این هفته کنفرانس سالانه خود، Google Cloud Next، را در لاس‌وگاس بر…

رضا باقری ( ۰ امتیاز )

ادب شما در برابر چت‌جی‌پی‌تی، میلیون‌ها دلار هزینه برق روی دست OpenAI می‌گذارد

شاید وقتش رسیده که ضرب‌المثل قدیمی “ادب خرجی ندارد” را به‌روز کنیم، چون حال…

رضا باقری ( ۰ امتیاز )

هوش مصنوعی به کمک رستوران‌گردها می‌آید؛ دستیار هوشمند اپن‌تیبل معرفی شد

شرکت رزرو رستوران اپن‌تیبل (OpenTable) از یک دستیار هوش مصنوعی جدید رونمایی…

رضا باقری ( ۰ امتیاز )