محققان هگینگ فیس در تلاشند نسخه‌ای بازتر از مدل «استدلال» هوش مصنوعی DeepSeek را بسازند.

محققان هگینگ فیس در تلاشند نسخه‌ای بازتر از مدل «استدلال» هوش مصنوعی DeepSeek را بسازند.

هفته‌ای پس از انتشار مدل هوش مصنوعی "استدلال" R1 توسط DeepSeek، محققان Hugging Face در تلاشند این مدل را از پایه بازسازی کنند و آن را تلاشی برای "دانش باز" می‌نامند.

محققان هاجینگ فیس در تلاشند نسخه‌ای بازتر از مدل «استدلال» AI دیپ‌سیک را بسازند.

Hugging Face researchers are trying to build a more open version of DeepSeek’s AI ‘reasoning’ model

تنها یک هفته پس از عرضه مدل هوش مصنوعی "استدلال" R1 از طرف DeepSeek، که بازارها را به هیجان انداخت، پژوهشگران شرکت Hugging Face در تلاشند تا این مدل را از ابتدا بازسازی کنند؛ پروژه‌ای که آن را تلاش برای "دانش باز" می‌نامند. رهبری تحقیق در Hugging Face، لئاندرو فون ورا، به همراه چند مهندس دیگر این شرکت، پروژه Open-R1 را آغاز کرده‌اند که هدف آن ساخت نسخه‌ای مشابه از R1 و ارائه کدهای منبع آزاد برای تمام اجزای آن، از جمله داده‌های استفاده شده برای آموزش مدل است. مهندسان این شرکت احساس کردند که فلسفه انتشار "جعبه سیاه" DeepSeek انگیزه‌ای قوی برای اقدام به این کار فراهم کرده است. به لحاظ فنی، مدل R1 "باز" است، به این معنا که مجوز آن به گونه‌ای است که می‌تواند به طور عمده بدون محدودیت بهره‌برداری شود. با این حال، R1 طبق تعریف پذیرفته شده عموماً "منبع باز" نیست زیرا برخی از ابزارهای استفاده شده برای ساخت آن در پرده‌ای از راز قرار دارند. مانند بسیاری از شرکت‌های پیشرو در حوزه هوش مصنوعی، DeepSeek تمایلی به افشای جزئیات خاص خود ندارد. ایلی باکوش، یکی از مهندسان Hugging Face در پروژه Open-R1، به TechCrunch گفت: "مدل R1 چشم‌گیر است، اما هیچ دیتاست باز، جزئیات تجربی یا مدل‌های میانی در دسترس نیست که این امر فرآیند بازتولید و تحقیق بیشتر را دشوار می‌کند. شفاف‌سازی کامل معماری R1 فقط به معنای شفافیت نیست، بلکه به معنای بازکردن پتانسیل‌های آن نیز می‌باشد." این پیشرفت‌ها می‌تواند تحولاتی در زمینه هوش مصنوعی ایجاد کند و امکانات جدیدی را برای پژوهشگران و توسعه‌دهندگان فراهم آورد. مردم می‌توانند برای کسب اطلاعات بیشتر به وب‌سایت ما در آدرس iwl.ir مراجعه کنند.

چندان باز نیست

Not so open

دیپ‌سیک، یک آزمایشگاه هوش مصنوعی چینی که به‌طور جزئی از یک صندوق پوشش کمی تأمین مالی می‌شود، هفته گذشته مدل R1 را منتشر کرد. این مدل در چندین ارزیابی به اندازه‌ای عملکرد بهتری نسبت به مدل استدلالی اوپن‌ای داشته و حتی در برخی موارد آن را پشت سر گذاشته است. R1 به عنوان یک مدل استدلالی، به‌خودش واقعیت‌ها را بررسی می‌کند که این ویژگی به آن کمک می‌کند تا از مشکلاتی که معمولاً مدل‌ها با آن مواجه می‌شوند، اجتناب کند. به‌طور کلی، مدل‌های استدلالی برای رسیدن به راه‌حل‌ها نسبت به مدل‌های غیر استدلالی به زمان بیشتری نیاز دارند، معمولاً از چند ثانیه تا چند دقیقه بیشتر. با این حال، این مدل‌ها در زمینه‌هایی مانند فیزیک، علم و ریاضیات به‌طرز قابل‌ملاحظه‌ای قابل‌اعتمادتر هستند.
مدل R1 پس از این‌که اپلیکیشن چت‌بات دیپ‌سیک، که دسترسی رایگان به R1 را فراهم می‌کند، به اوج چارت‌های اپ استور اپل رسید، مورد توجه عمومی قرار گرفت. سرعت و کارایی که دیپ‌سیک در توسعه این مدل به‌خرج داد — و در عرض چند هفته بعد از انتشار مدل اوپن‌ای، R1 را ارائه کرد — باعث شده تا بسیاری از تحلیلگران وال استریت و تکنولوژیست‌ها به این اندیشه بیفتند که آیا ایالات متحده می‌تواند برتری خود را در رقابت هوش مصنوعی حفظ کند یا خیر. پروژه Open-R1 کمتر نگران سلطه هوش مصنوعی ایالات متحده است و بیشتر بر روی "کاملاً باز کردن جعبه سیاه آموزش مدل" تمرکز کرده است. باکوش به تک کرانچ گفت: از آن‌جایی که مدل R1 بدون کد یا دستورالعمل‌های آموزشی منتشر شده است، مطالعه عمیق آن دشوار است و کنترل رفتار آن نیز چالش‌برانگیز است. او افزود: "کنترل بر روی دیتاست و فرآیند، برای به‌کارگیری مسئولانه یک مدل در زمینه‌های حساس بسیار مهم است." این بدان معناست که درک و مقابله با تعصبات موجود در مدل نیز به همین اندازه اهمیت دارد. محققان برای گسترش مرزهای ممکن به چیزی فراتر از تکه‌های اطلاعات نیاز دارند. در نهایت، موفقیت R1 نشان می‌دهد که زمینه‌های تحقیقاتی و کاربردی هوش مصنوعی به سرعت در حال گسترش است و به همین دلیل نیاز به شفافیت و ساختار در فرآیندهای آموزشی بیشتر احساس می‌شود.

مراحل کپی‌سازی

Steps to replication

مراحل تکرار
هدف پروژه Open-R1 تکرار مدل R1 در یک بازه چند هفته‌ای است که بخشی از آن به سرور تحقیقاتی Science Cluster دستاورد هاکینگ فِیس با ۷۶۸ واحد پردازشگر گرافیکی Nvidia H100 وابسته است. مهندسان هاکینگ فِیس قصد دارند از Science Cluster برای ایجاد datasets مشابه داده‌هایی که DeepSeek برای ساخت R1 استفاده کرده، بهره‌برداری کنند. برای ایجاد یک خط لوله آموزشی، این تیم از جامعه هوش مصنوعی و همچنین سایر حوزه‌های فناوری درخواست کمک کرده است. این همکاری‌ها در پلتفرم‌های هاکینگ فِیس و گیت‌هاب که پروژه Open-R1 در آنجا میزبانی می‌شود، انجام می‌گیرد. از سوی دیگر، فون ورا در گفتگو با TechCrunch گفت: "ما باید اطمینان حاصل کنیم که الگوریتم‌ها و دستور العمل‌ها را به درستی پیاده‌سازی کنیم؛ اما این یک تلاش جمعی است که بهترین راه حل‌ها را به ارمغان می‌آورد."
علاقه‌مندی زیادی در این زمینه وجود دارد. پروژه Open-R1 تنها در عرض سه روز در گیت‌هاب ۱۰,۰۰۰ ستاره کسب کرد که این ستاره‌ها به عنوان نشانه‌ای از محبوبیت و کارآمدی پروژه از سوی کاربران گیت‌هاب عمل می‌کنند. اگر پروژه Open-R1 موفق باشد، پژوهشگران هوش مصنوعی قادر خواهند بود بر اساس خط لوله آموزشی، نسل بعدی مدل‌های استدلال بازمتن را توسعه دهند. باکوش ابراز امیدواری کرد که پروژه Open-R1 نه‌تنها یک نسخه بازمتن قوی از R1 تولید کند، بلکه پایه‌ای برای بهبود مدل‌های آینده نیز فراهم آورد. او در ادامه گفت: "توسعه متن‌باز نه تنها به نفع همه است، بلکه همچنین به آزمایشگاه‌ها و تأمین‌کنندگان مدل‌ها این امکان را می‌دهد که همگی از یک نوآوری مشترک بهره‌مند شوند."
با وجود اینکه برخی از کارشناسان هوش مصنوعی نگران سوءاستفاده‌های احتمالی از هوش مصنوعی متن باز هستند، باکوش بر این باور است که فواید این روند بیشتر از خطرات آن است. او تصریح کرد: "زمانی که دستور تهیه R1 تکرار شود، هر کسی که بتواند چند GPU اجاره کند، می‌تواند نسخه‌ای از R1 با داده‌های خود بسازد و این تکنولوژی را به شکل گسترده‌تری منتشر کند." او همچنین گفت: "ما واقعاً درباره انتشارهای اخیر متن‌باز که نقش شفافیت را در هوش مصنوعی تقویت می‌کنند، هیجان‌زده هستیم. این یک تغییر مهم برای این حوزه است که روایت این‌طور تغییر می‌کند که تنها تعداد محدودی از آزمایشگاه‌ها قادر به پیشرفت هستند و توسعه متن‌باز عقب‌مانده است."
در نهایت، پروژه Open-R1 می‌تواند به تقویت همکاری در میان متخصصان و پژوهشگران در زمینه هوش مصنوعی کمک شایانی کند و بهترین شیوه‌ها را برای اشتراک‌گذاری و گسترش این تکنولوژی در سطح جهانی ایجاد کند.

پیشنهاد ویژه برای دریافت جدید ترین تحولات هوش مصنوعی

اولین نفری باشید که درباره جدید ترین های هوش مصنوعی، می خوانید!
همین امروز در سایت IWL.IR عضو شوید و از جدیدترین های روز دنیای فن آوری هوش مصنوعی بهره‌مند شوید.