مدل «استدلال» DeepSeek در برخی معیارها بهتر از o1 OpenAI است

هوش مصنوعی, Deepseek ادعا می کند که مدل استدلال آن در معیارهای

آزمایشگاه هوش مصنوعی چینی DeepSeek نسخه‌ باز DeepSeek-R1، مدل reasoning خود را منتشر کرده که ادعا می‌کند در برخی معیارهای هوش مصنوعی به خوبی مدل o1 OpenAI عمل می‌کند.

مدل «استدلال» DeepSeek در برخی معیارها از o1 OpenAI پیشی گرفته است.

DeepSeek claims its ‘reasoning’ model beats OpenAI’s o1 on certain benchmarks

آزمایشگاه هوش مصنوعی چینی DeepSeek نسخه‌ای آزاد از مدل استدلالی خود به نام DeepSeek-R1 را منتشر کرده است که ادعا می‌کند در برخی از benchmarks هوش مصنوعی، عملکردی مشابه با o1 شرکت OpenAI دارد. این مدل R1 در پلتفرم توسعه هوش مصنوعی Hugging Face تحت مجوز MIT در دسترس است، به این معنی که می‌توان از آن به‌طور تجاری و بدون محدودیت استفاده کرد. بر اساس اعلام DeepSeek، مدل R1 در مقایسه با o1 در benchmarkهای AIME، MATH-500 و SWE-bench Verified عملکرد بهتری نشان می‌دهد. مدل AIME از سایر مدل‌ها برای ارزیابی عملکرد یک مدل استفاده می‌کند، در حالی که MATH-500 مجموعه‌ای از مسائل کلامی است و SWE-bench Verified بیشتر بر روی وظایف برنامه‌نویسی تمرکز دارد.
مدل R1 به‌عنوان یک مدل استدلالی، به‌طور مؤثری صحت اطلاعات خود را بررسی می‌کند که این ویژگی به آن کمک می‌کند تا از مشکلاتی که معمولاً مدل‌ها با آن مواجه می‌شوند، دور بماند. در مقایسه با مدل‌های غیر استدلالی، این مدل‌ها معمولاً برای رسیدن به راه‌حل‌ها زمان بیشتری لازم دارند که معمولاً از چند ثانیه تا چند دقیقه متغیر است. با این حال، این زمان بیشتر به معنای اطمینان بیشتر در حوزه‌هایی مانند فیزیک، علوم و ریاضی است.
مدل R1 شامل 671 میلیارد پارامتر است که DeepSeek در یک گزارش فنی اعلام کرده است. پارامترها به طور کلی معادل مهارت‌های حل مسئله یک مدل هستند و مدل‌هایی که پارامترهای بیشتری دارند، معمولاً عملکرد بهتری نسبت به مدل‌هایی با پارامترهای کمتر دارند. با اینکه 671 میلیارد پارامتر عدد قابل توجهی است، DeepSeek همچنین نسخه‌های «تقطیر شده» از R1 را با اندازه‌های بین 1.5 میلیارد تا 70 میلیارد پارامتر منتشر کرده است. کوچک‌ترین نسخه قادر به اجرا بر روی لپ‌تاپ است.
اما مدل کامل R1 نیاز به سخت‌افزار قدرتمند‌تری دارد، اما این مدل از طریق API DeepSeek با قیمت‌های 90 تا 95 درصد کمتر از o1 OpenAI قابل دسترسی است. با این حال، یک نکته منفی در مورد R1 وجود دارد. به عنوان یک مدل چینی، این مدل تحت نظارت نهادهای اینترنتی چین قرار دارد تا اطمینان حاصل شود که پاسخ‌های آن «ارزش‌های اساسی سوسیالیستی» را منعکس می‌کند. به عنوان مثال، R1 به سوالات مربوط به میدان تیان‌آن‌من یا خودمختاری تایوان پاسخ نخواهد داد. بسیاری از سیستم‌های هوش مصنوعی چینی، از جمله سایر مدل‌های استدلالی، تمایلی به پاسخ‌گویی به موضوعاتی که ممکن است خشم نهادهای نظارتی کشور را برانگیزد، ندارند.
این اطلاعات در حالی منتشر می‌شود که تنها چند روز پس از پیشنهاد دولت بایدن برای وضع قوانین سخت‌گیرانه تر صادرات و محدودیت‌های تکنولوژی‌های هوش مصنوعی برای شرکت‌های چینی، به وقوع می‌پیوندد. شرکت‌های چینی پیشتر از خرید تراشه‌های پیشرفته هوش مصنوعی منع شده بودند، اما اگر این قوانین جدید اجرایی شوند، شرکت‌ها با محدودیت‌های بیشتری در زمینه فناوری‌های نیمه‌رسانا و مدل‌های مورد نیاز برای راه‌اندازی سیستم‌های هوش مصنوعی پیچیده مواجه خواهند شد. OpenAI در یک سند سیاست اخیر، از دولت ایالات متحده خواسته تا از توسعه هوش مصنوعی آمریکایی حمایت کند، در غیر این صورت مدل‌های چینی ممکن است با آن‌ها هم‌سطح یا حتی پیشی بگیرند.
در مصاحبه‌ای با The Information، Chris Lehane، معاون سیاست‌گذاری OpenAI، به سرمایه‌گذاری High Flyer Capital Management، والد شرکت DeepSeek، به‌عنوان یک نگرانی خاص اشاره کرد. تاکنون، حداقل سه آزمایشگاه چینی — DeepSeek، Alibaba و Kimi متعلق به شرکت چینی Moonshot AI — مدل‌هایی تولید کرده‌اند که ادعا می‌کنند با o1 رقابت می‌کنند. Dean Ball، محقق هوش مصنوعی در دانشگاه جورج میسون، در پستی در شبکه X گفت که این روند نشان می‌دهد آزمایشگاه‌های هوش مصنوعی چینی به ادامه تولید مدل‌های مؤثر و با قابلیت بالا تمایل دارند که روی سخت‌افزار محلی اجرا شوند. بر اساس اطلاعات وب‌سایت ما iwl.ir، این روند نشان می‌دهد که در آینده، سیستم‌های هوش مصنوعی پیشرفته‌تری در دسترس خواهند بود در حالی که تحت هیچ گونه نظارت سخت‌گیرانه‌ای قرار نخواهند گرفت.

AI
AI
chinese ai
chinese labs
deepseek
deepseek-r1
Generative AI
high flyer
Open AI
r1
reasoning model