مدل «استدلال» DeepSeek در برخی معیارها بهتر از o1 OpenAI است.
DeepSeek claims its ‘reasoning’ model beats OpenAI’s o1 on certain benchmarks
آزمایشگاه هوش مصنوعی چینی "دیپسیک" نسخهای آزاد از مدل استدلال خود به نام "دیپسیک-R1" را منتشر کرده است که ادعا میکند در برخی معیارهای هوش مصنوعی به خوبی مدل o1 شرکت OpenAI عمل میکند. این مدل در پلتفرم توسعه هوش مصنوعی "هاگینگ فیس" تحت مجوز MIT در دسترس است که به معنای استفاده تجاری بدون محدودیت است. براساس ادعای دیپسیک، R1 در معیارهای AIME، MATH-500 و SWE-bench Verified از مدل o1 برتر است. AIME از مدلهای دیگر برای ارزیابی عملکرد یک مدل استفاده میکند، در حالی که MATH-500 مجموعهای از مسائل واژهای است و SWE-bench Verified بر روی وظایف برنامهنویسی تمرکز دارد. به عنوان یک مدل استدلالی، R1 به طور مؤثر به خود اطلاعات درست میدهد که به آن کمک میکند تا از برخی نقاط ضعف که معمولاً مدلها را دچار مشکل میکند، اجتناب کند. مدلهای استدلالی معمولاً زمان بیشتری برای رسیدن به راهحلها نیاز دارند—معمولاً چند ثانیه تا چند دقیقه بیشتر از یک مدل غیر استدلالی—اما مزیت آنها این است که در حوزههایی مانند فیزیک، علم و ریاضیات معمولاً بیشتر قابل اعتماد هستند.
دیپسیک در یک گزارش فنی اعلام کرده که R1 شامل 671 میلیارد پارامتر است. پارامترها بهطور تقریبی با مهارتهای حل مسئله یک مدل مرتبط هستند و مدلهایی که پارامترهای بیشتری دارند معمولاً عملکرد بهتری نسبت به مدلهایی با پارامترهای کمتر دارند. 671 میلیارد پارامتر رقم بسیار بالایی است، اما دیپسیک همچنین نسخههای "تقلیلیافته" R1 را منتشر کرده که اندازه آنها بین 1.5 میلیارد تا 70 میلیارد پارامتر متغیر است. کوچکترین نسخه میتواند بر روی یک لپتاپ اجرا شود. در مورد نسخه کامل R1، به سختافزار قویتری نیاز است، اما این مدل از طریق API دیپسیک با قیمتهایی 90 تا 95 درصد ارزانتر از مدل o1 OpenAI در دسترس است.
به گفته «کلم دلانگ»، مدیرعامل هاگینگ فیس، توسعهدهندگان در این پلتفرم بیش از 500 مدل "مشتقشده" از R1 ایجاد کردهاند که به صورت مجموع 2.5 میلیون بار دانلود شدهاند—پنج برابر تعداد دانلودهایی که نسخه رسمی R1 داشته است. این مدل چند روز پیش منتشر شده و به سرعت به محبوبیت بالایی دست یافته است.
با این حال، یک نکته منفی در مورد R1 وجود دارد. به عنوان یک مدل چینی، تحت بررسیهای نهادهای اینترنتی چین قرار دارد تا اطمینان حاصل شود که پاسخهای آن "ارزشهای اصلی سوسیالیستی" را منعکس میکند. به عنوان مثال، R1 به سؤالات مربوط به میدان تیانآنمن یا خودمختاری تایوان پاسخ نخواهد داد. بسیاری از سیستمهای هوش مصنوعی چینی، از جمله مدلهای استدلالی دیگر، از پاسخ به موضوعاتی که ممکن است خشم نهادهای نظارتی کشور را برانگیزد، خودداری میکنند.
انتشار R1 تنها چند روز پس از پیشنهاد دولت بایدن بابت سختگیریهای بیشتر در صادرات فناوریهای هوش مصنوعی برای شرکتهای چینی انجام شده است. شرکتها در چین از خرید تراشههای پیشرفته AI منع شده بودند و در صورت اجرایی شدن قانونهای جدید، با محدودیتهای بیشتری در مورد تکنولوژیهای نیمه هادی و مدلهای لازم برای راهاندازی سیستمهای پیچیده هوش مصنوعی روبرو خواهند شد. در یک سند سیاستی اخیر، OpenAI از دولت ایالات متحده درخواست کرده است تا از توسعه هوش مصنوعی آمریکایی حمایت کند وگرنه ممکن است مدلهای چینی برابری یا حتی برتری را در قابلیتها پیدا کنند. در یک مصاحبه، "کریس لهانه"، معاون سیاستگذاری OpenAI، به "های فلایر کپیتال منیجمنت"، که والد شرکتی دیپسیک است، به عنوان یک نهاد خاص نگرانی اشاره کرده است.
به طور کلی، به نظر میرسد آزمایشگاههای هوش مصنوعی چینی به سرعت به دنبال توسعه مدلهای جدیدی هستند که توانایی بالایی را به نمایش میگذارند. این به این معنی است که در آیندهای نزدیک، ما شاهد گسترش توانمندیهای جدیدی خواهیم بود که میتواند خلأهای موجود در بازارهای جهانی هوش مصنوعی را پر کند. برای کسب اطلاعات بیشتر میتوانید به سایت iwl.ir مراجعه کنید.
- AI
- AI
- chinese ai
- chinese labs
- deepseek
- deepseek-r1
- Generative AI
- high flyer
- Open AI
- r1
- reasoning model