دیپ‌سیک ادعا می‌کند که مدل «استدلال» آن در برخی معیارها از o1 اوپن‌ای‌آی پیشی می‌گیرد.

هوش مصنوعی, Deepseek ادعا می کند که مدل استدلال خود Openais O1

آزمایشگاه هوش مصنوعی چینی DeepSeek نسخه باز DeepSeek-R1، مدل استدلال خود، را منتشر کرده که گفته می‌شود در برخی شاخص‌های هوش مصنوعی عملکردی مشابه OpenAI o1 دارد.

مدل «استدلال» DeepSeek در برخی معیارها بهتر از o1 OpenAI است.

DeepSeek claims its ‘reasoning’ model beats OpenAI’s o1 on certain benchmarks

آزمایشگاه هوش مصنوعی چینی "دیپ‌سیک" نسخه‌ای آزاد از مدل استدلال خود به نام "دیپ‌سیک-R1" را منتشر کرده است که ادعا می‌کند در برخی معیارهای هوش مصنوعی به خوبی مدل o1 شرکت OpenAI عمل می‌کند. این مدل در پلتفرم توسعه هوش مصنوعی "هاگینگ فیس" تحت مجوز MIT در دسترس است که به معنای استفاده تجاری بدون محدودیت است. براساس ادعای دیپ‌سیک، R1 در معیارهای AIME، MATH-500 و SWE-bench Verified از مدل o1 برتر است. AIME از مدل‌های دیگر برای ارزیابی عملکرد یک مدل استفاده می‌کند، در حالی که MATH-500 مجموعه‌ای از مسائل واژه‌ای است و SWE-bench Verified بر روی وظایف برنامه‌نویسی تمرکز دارد. به عنوان یک مدل استدلالی، R1 به طور مؤثر به خود اطلاعات درست می‌دهد که به آن کمک می‌کند تا از برخی نقاط ضعف که معمولاً مدل‌ها را دچار مشکل می‌کند، اجتناب کند. مدل‌های استدلالی معمولاً زمان بیشتری برای رسیدن به راه‌حل‌ها نیاز دارند—معمولاً چند ثانیه تا چند دقیقه بیشتر از یک مدل غیر استدلالی—اما مزیت آن‌ها این است که در حوزه‌هایی مانند فیزیک، علم و ریاضیات معمولاً بیشتر قابل اعتماد هستند.
دیپ‌سیک در یک گزارش فنی اعلام کرده که R1 شامل 671 میلیارد پارامتر است. پارامترها به‌طور تقریبی با مهارت‌های حل مسئله یک مدل مرتبط هستند و مدل‌هایی که پارامترهای بیشتری دارند معمولاً عملکرد بهتری نسبت به مدل‌هایی با پارامترهای کمتر دارند. 671 میلیارد پارامتر رقم بسیار بالایی است، اما دیپ‌سیک همچنین نسخه‌های "تقلیل‌یافته" R1 را منتشر کرده که اندازه آن‌ها بین 1.5 میلیارد تا 70 میلیارد پارامتر متغیر است. کوچک‌ترین نسخه می‌تواند بر روی یک لپ‌تاپ اجرا شود. در مورد نسخه کامل R1، به سخت‌افزار قوی‌تری نیاز است، اما این مدل از طریق API دیپ‌سیک با قیمت‌هایی 90 تا 95 درصد ارزان‌تر از مدل o1 OpenAI در دسترس است.
به گفته «کلم دلانگ»، مدیرعامل هاگینگ فیس، توسعه‌دهندگان در این پلتفرم بیش از 500 مدل "مشتق‌شده" از R1 ایجاد کرده‌اند که به صورت مجموع 2.5 میلیون بار دانلود شده‌اند—پنج برابر تعداد دانلودهایی که نسخه رسمی R1 داشته است. این مدل چند روز پیش منتشر شده و به سرعت به محبوبیت بالایی دست یافته است.
با این حال، یک نکته منفی در مورد R1 وجود دارد. به عنوان یک مدل چینی، تحت بررسی‌های نهادهای اینترنتی چین قرار دارد تا اطمینان حاصل شود که پاسخ‌های آن "ارزش‌های اصلی سوسیالیستی" را منعکس می‌کند. به عنوان مثال، R1 به سؤالات مربوط به میدان تیان‌آن‌من یا خودمختاری تایوان پاسخ نخواهد داد. بسیاری از سیستم‌های هوش مصنوعی چینی، از جمله مدل‌های استدلالی دیگر، از پاسخ به موضوعاتی که ممکن است خشم نهادهای نظارتی کشور را برانگیزد، خودداری می‌کنند.
انتشار R1 تنها چند روز پس از پیشنهاد دولت بایدن بابت سخت‌گیری‌های بیشتر در صادرات فناوری‌های هوش مصنوعی برای شرکت‌های چینی انجام شده است. شرکت‌ها در چین از خرید تراشه‌های پیشرفته AI منع شده بودند و در صورت اجرایی شدن قانون‌های جدید، با محدودیت‌های بیشتری در مورد تکنولوژی‌های نیمه هادی و مدل‌های لازم برای راه‌اندازی سیستم‌های پیچیده هوش مصنوعی روبرو خواهند شد. در یک سند سیاستی اخیر، OpenAI از دولت ایالات متحده درخواست کرده است تا از توسعه هوش مصنوعی آمریکایی حمایت کند وگرنه ممکن است مدل‌های چینی برابری یا حتی برتری را در قابلیت‌ها پیدا کنند. در یک مصاحبه، "کریس لهانه"، معاون سیاستگذاری OpenAI، به "های فلایر کپیتال منیجمنت"، که والد شرکتی دیپ‌سیک است، به عنوان یک نهاد خاص نگرانی اشاره کرده است.
به طور کلی، به نظر می‌رسد آزمایشگاه‌های هوش مصنوعی چینی به سرعت به دنبال توسعه مدل‌های جدیدی هستند که توانایی بالایی را به نمایش می‌گذارند. این به این معنی است که در آینده‌ای نزدیک، ما شاهد گسترش توانمندی‌های جدیدی خواهیم بود که می‌تواند خلأهای موجود در بازارهای جهانی هوش مصنوعی را پر کند. برای کسب اطلاعات بیشتر می‌توانید به سایت iwl.ir مراجعه کنید.

AI
AI
chinese ai
chinese labs
deepseek
deepseek-r1
Generative AI
high flyer
Open AI
r1
reasoning model