مدل «استدلال» DeepSeek در برخی معیارها از o1 OpenAI پیشی گرفته است.
DeepSeek claims its ‘reasoning’ model beats OpenAI’s o1 on certain benchmarks

آزمایشگاه هوش مصنوعی چینی DeepSeek نسخهای آزاد از مدل استدلالی خود به نام DeepSeek-R1 را منتشر کرده است که ادعا میکند در برخی از benchmarks هوش مصنوعی، عملکردی مشابه با o1 شرکت OpenAI دارد. این مدل R1 در پلتفرم توسعه هوش مصنوعی Hugging Face تحت مجوز MIT در دسترس است، به این معنی که میتوان از آن بهطور تجاری و بدون محدودیت استفاده کرد. بر اساس اعلام DeepSeek، مدل R1 در مقایسه با o1 در benchmarkهای AIME، MATH-500 و SWE-bench Verified عملکرد بهتری نشان میدهد. مدل AIME از سایر مدلها برای ارزیابی عملکرد یک مدل استفاده میکند، در حالی که MATH-500 مجموعهای از مسائل کلامی است و SWE-bench Verified بیشتر بر روی وظایف برنامهنویسی تمرکز دارد.
مدل R1 بهعنوان یک مدل استدلالی، بهطور مؤثری صحت اطلاعات خود را بررسی میکند که این ویژگی به آن کمک میکند تا از مشکلاتی که معمولاً مدلها با آن مواجه میشوند، دور بماند. در مقایسه با مدلهای غیر استدلالی، این مدلها معمولاً برای رسیدن به راهحلها زمان بیشتری لازم دارند که معمولاً از چند ثانیه تا چند دقیقه متغیر است. با این حال، این زمان بیشتر به معنای اطمینان بیشتر در حوزههایی مانند فیزیک، علوم و ریاضی است.
مدل R1 شامل 671 میلیارد پارامتر است که DeepSeek در یک گزارش فنی اعلام کرده است. پارامترها به طور کلی معادل مهارتهای حل مسئله یک مدل هستند و مدلهایی که پارامترهای بیشتری دارند، معمولاً عملکرد بهتری نسبت به مدلهایی با پارامترهای کمتر دارند. با اینکه 671 میلیارد پارامتر عدد قابل توجهی است، DeepSeek همچنین نسخههای «تقطیر شده» از R1 را با اندازههای بین 1.5 میلیارد تا 70 میلیارد پارامتر منتشر کرده است. کوچکترین نسخه قادر به اجرا بر روی لپتاپ است.
اما مدل کامل R1 نیاز به سختافزار قدرتمندتری دارد، اما این مدل از طریق API DeepSeek با قیمتهای 90 تا 95 درصد کمتر از o1 OpenAI قابل دسترسی است. با این حال، یک نکته منفی در مورد R1 وجود دارد. به عنوان یک مدل چینی، این مدل تحت نظارت نهادهای اینترنتی چین قرار دارد تا اطمینان حاصل شود که پاسخهای آن «ارزشهای اساسی سوسیالیستی» را منعکس میکند. به عنوان مثال، R1 به سوالات مربوط به میدان تیانآنمن یا خودمختاری تایوان پاسخ نخواهد داد. بسیاری از سیستمهای هوش مصنوعی چینی، از جمله سایر مدلهای استدلالی، تمایلی به پاسخگویی به موضوعاتی که ممکن است خشم نهادهای نظارتی کشور را برانگیزد، ندارند.
این اطلاعات در حالی منتشر میشود که تنها چند روز پس از پیشنهاد دولت بایدن برای وضع قوانین سختگیرانه تر صادرات و محدودیتهای تکنولوژیهای هوش مصنوعی برای شرکتهای چینی، به وقوع میپیوندد. شرکتهای چینی پیشتر از خرید تراشههای پیشرفته هوش مصنوعی منع شده بودند، اما اگر این قوانین جدید اجرایی شوند، شرکتها با محدودیتهای بیشتری در زمینه فناوریهای نیمهرسانا و مدلهای مورد نیاز برای راهاندازی سیستمهای هوش مصنوعی پیچیده مواجه خواهند شد. OpenAI در یک سند سیاست اخیر، از دولت ایالات متحده خواسته تا از توسعه هوش مصنوعی آمریکایی حمایت کند، در غیر این صورت مدلهای چینی ممکن است با آنها همسطح یا حتی پیشی بگیرند.
در مصاحبهای با The Information، Chris Lehane، معاون سیاستگذاری OpenAI، به سرمایهگذاری High Flyer Capital Management، والد شرکت DeepSeek، بهعنوان یک نگرانی خاص اشاره کرد. تاکنون، حداقل سه آزمایشگاه چینی — DeepSeek، Alibaba و Kimi متعلق به شرکت چینی Moonshot AI — مدلهایی تولید کردهاند که ادعا میکنند با o1 رقابت میکنند. Dean Ball، محقق هوش مصنوعی در دانشگاه جورج میسون، در پستی در شبکه X گفت که این روند نشان میدهد آزمایشگاههای هوش مصنوعی چینی به ادامه تولید مدلهای مؤثر و با قابلیت بالا تمایل دارند که روی سختافزار محلی اجرا شوند. بر اساس اطلاعات وبسایت ما iwl.ir، این روند نشان میدهد که در آینده، سیستمهای هوش مصنوعی پیشرفتهتری در دسترس خواهند بود در حالی که تحت هیچ گونه نظارت سختگیرانهای قرار نخواهند گرفت.
- AI
- AI
- chinese ai
- chinese labs
- deepseek
- deepseek-r1
- Generative AI
- high flyer
- Open AI
- r1
- reasoning model