DeepSeek: هر آنچه باید درباره اپلیکیشن چت‌بات هوش مصنوعی بدانید

DeepSeek: هر آنچه باید درباره اپلیکیشن چت‌بات هوش مصنوعی بدانید

دیپ‌سیک به شدت معروف شده است.

دیپ‌سیک: هر آنچه باید درباره اپ چت‌بات هوش مصنوعی بدانید

DeepSeek: Everything you need to know about the AI chatbot app

هفته گذشته، لابراتور هوش مصنوعی چینی دیپ‌سیک (DeepSeek) به طرز چشمگیری مورد توجه عموم قرار گرفت. این اتفاق پس از آن افتاد که اپلیکیشن چت‌بات آن به صدر لیست فروشگاه اپل و همچنین گوگل پلی رسید. مدل‌های هوش مصنوعی دیپ‌سیک که با استفاده از تکنیک‌های محاسباتی کارآمد آموزش دیده‌اند، موجب شده‌اند تا تحلیلگران وال‌استریت و کارشناسان فنّاوری ابراز نگرانی کنند که آیا ایالات متحده می‌تواند در رقابت هوش مصنوعی پیشتاز بماند و آیا تقاضا برای تراشه‌های هوش مصنوعی پایدار خواهد ماند یا خیر. اما دیپ‌سیک از کجا آمده و چگونه به این سرعت به شهرت جهانی دست یافت؟
این موفقیت ناگهانی نشان دهنده قابلیت‌های برجسته این شرکت در زمینه توسعه تکنولوژی هوش مصنوعی است و می‌تواند تأثیرات چشمگیری بر آینده صنعت فناوری داشته باشد. سایت ما، iwl.ir، به بررسی دقیق‌تر این موضوع خواهد پرداخت و جوانب مختلف این پیشرفت را مورد تحلیل قرار خواهد داد.

منشأ تریدرهای دیپ‌سیک

DeepSeek’s trader origins

دیپ‌سیک، به عنوان یک شرکت پیشرو در زمینه هوش مصنوعی، توسط شرکت مدیریت سرمایه‌های های ‌فلایر تأسیس شده است؛ این شرکت یک هچ‌فاند کمی در چین است که از هوش مصنوعی برای ارتقای تصمیمات تجاری خود بهره می‌برد. لیانگ ونفنگ، که از طرفداران هوش مصنوعی محسوب می‌شود، در سال ۲۰۱۵ های‌فلایر را تأسیس کرد. وی که reportedly از دوران دانشجویی خود در دانشگاه ژجیانگ به معامله‌گری علاقه‌مند بود، در سال ۲۰۱۹ این هچ‌فاند را با هدف توسعه و پیاده‌سازی الگوریتم‌های هوش مصنوعی راه‌اندازی کرد.
در سال ۲۰۲۳، های‌فلایر دیپ‌سیک را به عنوان یک آزمایشگاه اختصاصی برای تحقیق در ابزارهای هوش مصنوعی ایجاد کرد که از کسب‌وکار مالی آن جدا بود. این آزمایشگاه به‌ تدریج به یک شرکت مستقل با همین نام، دیپ‌سیک، تبدیل شد و از همان روز اول، زیرساخت‌های مرکز داده ویژه‌ای برای آموزش مدل‌های خود راه‌اندازی کرد. اما دیپ‌سیک نیز مانند دیگر شرکت‌های هوش مصنوعی در چین تحت تأثیر ممنوعیت‌های صادراتی ایالات متحده بر روی سخت‌افزارهای خاص قرار گرفته است. برای آموزش یکی از مدل‌های جدید خود، این شرکت مجبور به استفاده از چیپ‌های Nvidia H800 شد که نسخه‌ای ضعیف‌تر از چیپ H100 است که در اختیار شرکت‌های آمریکایی قرار دارد.
گفته می‌شود تیم فنی دیپ‌سیک احتمالا جوانان بااستعدادی را در بر می‌گیرد. این شرکت با جذب محققان دکتری در زمینه هوش مصنوعی از بهترین دانشگاه‌های چین به شدت تلاش می‌کند تا کادر تخصصی خود را تقویت کند. علاوه بر این، دیپ‌سیک افرادی را نیز استخدام می‌کند که هیچ پس‌زمینه‌ای در علوم کامپیوتر ندارند تا به تیم فنی کمک کنند تا مسائل و موضوعات گوناگونی را بهتر درک و تحلیل کند. این رویکرد نشان‌دهنده تمایل دیپ‌سیک برای ترکیب تجارب مختلف و جلب دانش در حوزه هوش مصنوعی است، که می‌تواند نقاط قوت بیشتری را برای بررسی‌های آینده فراهم کند.

مدل‌های قدرتمند دیپ‌سیک

DeepSeek’s strong models

مدل‌های قوی DeepSeek
در نوامبر 2023، شرکت DeepSeek نخستین مجموعه از مدل‌های خود شامل DeepSeek Coder، DeepSeek LLM و DeepSeek Chat را معرفی کرد. اما این زمانی بود که در بهار گذشته، استارتاپ DeepSeek خانواده مدل‌های نسل بعدی خود را به نام DeepSeek-V2 عرضه کرد که توجه صنعت هوش مصنوعی را به خود جلب کرد. سیستم DeepSeek-V2، که به‌عنوان یک سیستم تحلیلی عمومی برای متن و تصویر طراحی شده است، در ارزیابی‌های مختلف هوش مصنوعی عملکرد خوبی داشته و هزینه‌های اجرایی آن نسبت به مدل‌های مشابه در آن زمان بسیار کمتر بوده است. این وضعیت باعث شد رقبا داخلی DeepSeek، از جمله ByteDance و Alibaba، قیمت استفاده از برخی مدل‌های خود را کاهش دهند و برخی دیگر را به‌طور کامل رایگان کنند.
مدل DeepSeek-V3 که در دسامبر 2024 معرفی شد، شهرت DeepSeek را بیشتر کرد. طبق آزمایش‌های داخلی DeepSeek، این مدل، با مدل‌های قابل دانلود و دسترس‌پذیر آزاد مثل Llama و مدل‌های "بسته" که فقط از طریق API قابل دسترسی هستند، مانند GPT-4o، عملکرد بهتری داشت. یکی از مدل‌های تحسین‌انگیز DeepSeek، مدل استدلالی R1 است که در ژانویه منتشر شد. DeepSeek ادعا می‌کند که این مدل در ارزیابی‌های کلیدی به اندازه مدل o1 از OpenAI عملکرد خوبی دارد.
R1 به‌عنوان یک مدل استدلالی، به‌طور مؤثری خود را بررسی می‌کند و همین موضوع کمک می‌کند تا از برخی مشکلاتی که معمولاً مدل‌ها با آن مواجه می‌شوند، اجتناب کند. مدل‌های استدلالی معمولاً زمان بیشتری برای رسیدن به راه‌حل‌ها نیاز دارند—معمولاً چند ثانیه تا چند دقیقه بیشتر از مدل‌های غیر استدلالی—اما در عوض، در زمینه‌هایی مانند فیزیک، علم و ریاضیات از دقت بیشتری برخوردارند.
با این حال، یک نقطه ضعف برای R1، DeepSeek V3 و سایر مدل‌های DeepSeek وجود دارد. این مدل‌ها که به‌طور خاص در چین توسعه یافته‌اند، باید تحت ارزیابی‌های نهادهای نظارتی اینترنت چین قرار بگیرند تا اطمینان حاصل شود که پاسخ‌های آن‌ها «مفاهیم و ارزش‌های اصلی سوسیالیستی» را نمایندگی می‌کند. به عنوان مثال، در اپلیکیشن چت‌بات DeepSeek، R1 به سوالات مربوط به میدان تیان‌آن‌من یا خودمختاری تایوان پاسخ نمی‌دهد. این موضوع محدودیت‌هایی را برای کاربران ایجاد می‌کند و می‌تواند بر روی استفاده از این فناوری تأثیرگذار باشد.

پیشنهاد ویژه برای دریافت جدید ترین تحولات هوش مصنوعی

اولین نفری باشید که درباره جدید ترین های هوش مصنوعی، می خوانید!
همین امروز در سایت IWL.IR عضو شوید و از جدیدترین های روز دنیای فن آوری هوش مصنوعی بهره‌مند شوید.

رویکردی انقلابی

A disruptive approach

رویکردی disruptiv
اگرچه DeepSeek مدل تجاری مشخصی دارد، اما تعریف دقیقی از آن ارائه نشده است. این شرکت قیمت محصولات و خدمات خود را به طور معناداری پایین‌تر از ارزش واقعی بازار تعیین کرده و حتی برخی از آنها را به صورت رایگان عرضه می‌کند. به ادعای DeepSeek، breakthroughs در کارایی به آن امکان رقابت قیمتی شدیدی را داده است. با این حال، برخی از کارشناسان به اعداد و ارقام ارائه شده از سوی این شرکت شک دارند. به هر حال، توسعه‌دهندگان به مدل‌های DeepSeek علاقه‌مند شده‌اند که اگرچه به معنای رایج متن باز نیستند، اما تحت مجوزهای سهل‌گیرانه‌ای برای استفاده تجاری در دسترس قرار دارند. طبق گفته‌های کلِم دیلانگ، مدیرعامل Hugging Face، یکی از پلتفرم‌های میزبان مدل‌های DeepSeek، توسعه‌دهندگان در Hugging Face بیش از 500 مدل «فرعی» از R1 ایجاد کرده‌اند که مجموعاً 2.5 میلیون بار دانلود شده‌اند.
موفقیت DeepSeek در برابر رقبای بزرگ‌تر و جاافتاده به عنوان «انقلاب در AI» و «تبلیغات اغراق‌آمیز» توصیف شده است. موفقیت این شرکت بخشی از دلایل کاهش قیمت سهام Nvidia به میزان 18 درصد در روز دوشنبه بود و واکنش عمومی سام آلتمن، مدیرعامل OpenAI را به دنبال داشت. مایکروسافت اعلام کرده که DeepSeek در خدمات Azure AI Foundry خود که پلتفرمی برای گردآوری خدمات هوش مصنوعی برای کسب‌وکارها است، در دسترس است.
زمانی که از مارک زاکربرگ، مدیرعامل متا، درباره تأثیر DeepSeek بر هزینه‌های هوش مصنوعی این شرکت در تماس درآمدهای مالی سه‌ماهه اول پرسیده شد، او اظهار داشت که هزینه‌های زیرساخت هوش مصنوعی همچنان به عنوان یک «مزیت استراتژیک» برای متا ادامه خواهد داشت. در مورد آینده DeepSeek هنوز ابهامات زیادی وجود دارد. بهبود مدل‌ها امری بدیهی است، اما به نظر می‌رسد دولت ایالات متحده نسبت به تأثیرات خارجی مضر و نگرانی‌ها در این زمینه حسی احتیاط‌آمیز پیدا کرده است.
در نهایت، جالب است بدانیم که TechCrunch یک خبرنامه متمرکز بر هوش مصنوعی دارد و می‌توانید برای دریافت آن هر چهارشنبه در ایمیل خود ثبت‌نام کنید. این داستان در اصل در تاریخ 28 ژانویه منتشر شده و به طور مداوم با اطلاعات جدید به‌روز خواهد شد.