محققان هگینگ فیس در تلاشند نسخهای بازتر از مدل «استدلال» هوش مصنوعی DeepSeek را بسازند.
هوش مصنوعی, محققان بغل کردن چهره در تلاشند تا نسخه بازتر مدل ا
هفتهای پس از انتشار مدل هوش مصنوعی "استدلال" R1 توسط DeepSeek، محققان Hugging Face در تلاشند این مدل را از پایه بازسازی کنند و آن را تلاشی برای "دانش باز" مینامند.
محققان هاجینگ فیس در تلاشند نسخهای بازتر از مدل «استدلال» AI دیپسیک را بسازند.
Hugging Face researchers are trying to build a more open version of DeepSeek’s AI ‘reasoning’ model
تنها یک هفته پس از عرضه مدل هوش مصنوعی "استدلال" R1 از طرف DeepSeek، که بازارها را به هیجان انداخت، پژوهشگران شرکت Hugging Face در تلاشند تا این مدل را از ابتدا بازسازی کنند؛ پروژهای که آن را تلاش برای "دانش باز" مینامند. رهبری تحقیق در Hugging Face، لئاندرو فون ورا، به همراه چند مهندس دیگر این شرکت، پروژه Open-R1 را آغاز کردهاند که هدف آن ساخت نسخهای مشابه از R1 و ارائه کدهای منبع آزاد برای تمام اجزای آن، از جمله دادههای استفاده شده برای آموزش مدل است. مهندسان این شرکت احساس کردند که فلسفه انتشار "جعبه سیاه" DeepSeek انگیزهای قوی برای اقدام به این کار فراهم کرده است. به لحاظ فنی، مدل R1 "باز" است، به این معنا که مجوز آن به گونهای است که میتواند به طور عمده بدون محدودیت بهرهبرداری شود. با این حال، R1 طبق تعریف پذیرفته شده عموماً "منبع باز" نیست زیرا برخی از ابزارهای استفاده شده برای ساخت آن در پردهای از راز قرار دارند. مانند بسیاری از شرکتهای پیشرو در حوزه هوش مصنوعی، DeepSeek تمایلی به افشای جزئیات خاص خود ندارد. ایلی باکوش، یکی از مهندسان Hugging Face در پروژه Open-R1، به TechCrunch گفت: "مدل R1 چشمگیر است، اما هیچ دیتاست باز، جزئیات تجربی یا مدلهای میانی در دسترس نیست که این امر فرآیند بازتولید و تحقیق بیشتر را دشوار میکند. شفافسازی کامل معماری R1 فقط به معنای شفافیت نیست، بلکه به معنای بازکردن پتانسیلهای آن نیز میباشد." این پیشرفتها میتواند تحولاتی در زمینه هوش مصنوعی ایجاد کند و امکانات جدیدی را برای پژوهشگران و توسعهدهندگان فراهم آورد. مردم میتوانند برای کسب اطلاعات بیشتر به وبسایت ما در آدرس iwl.ir مراجعه کنند.
چندان باز نیست
Not so open
دیپسیک، یک آزمایشگاه هوش مصنوعی چینی که بهطور جزئی از یک صندوق پوشش کمی تأمین مالی میشود، هفته گذشته مدل R1 را منتشر کرد. این مدل در چندین ارزیابی به اندازهای عملکرد بهتری نسبت به مدل استدلالی اوپنای داشته و حتی در برخی موارد آن را پشت سر گذاشته است. R1 به عنوان یک مدل استدلالی، بهخودش واقعیتها را بررسی میکند که این ویژگی به آن کمک میکند تا از مشکلاتی که معمولاً مدلها با آن مواجه میشوند، اجتناب کند. بهطور کلی، مدلهای استدلالی برای رسیدن به راهحلها نسبت به مدلهای غیر استدلالی به زمان بیشتری نیاز دارند، معمولاً از چند ثانیه تا چند دقیقه بیشتر. با این حال، این مدلها در زمینههایی مانند فیزیک، علم و ریاضیات بهطرز قابلملاحظهای قابلاعتمادتر هستند. مدل R1 پس از اینکه اپلیکیشن چتبات دیپسیک، که دسترسی رایگان به R1 را فراهم میکند، به اوج چارتهای اپ استور اپل رسید، مورد توجه عمومی قرار گرفت. سرعت و کارایی که دیپسیک در توسعه این مدل بهخرج داد — و در عرض چند هفته بعد از انتشار مدل اوپنای، R1 را ارائه کرد — باعث شده تا بسیاری از تحلیلگران وال استریت و تکنولوژیستها به این اندیشه بیفتند که آیا ایالات متحده میتواند برتری خود را در رقابت هوش مصنوعی حفظ کند یا خیر. پروژه Open-R1 کمتر نگران سلطه هوش مصنوعی ایالات متحده است و بیشتر بر روی "کاملاً باز کردن جعبه سیاه آموزش مدل" تمرکز کرده است. باکوش به تک کرانچ گفت: از آنجایی که مدل R1 بدون کد یا دستورالعملهای آموزشی منتشر شده است، مطالعه عمیق آن دشوار است و کنترل رفتار آن نیز چالشبرانگیز است. او افزود: "کنترل بر روی دیتاست و فرآیند، برای بهکارگیری مسئولانه یک مدل در زمینههای حساس بسیار مهم است." این بدان معناست که درک و مقابله با تعصبات موجود در مدل نیز به همین اندازه اهمیت دارد. محققان برای گسترش مرزهای ممکن به چیزی فراتر از تکههای اطلاعات نیاز دارند. در نهایت، موفقیت R1 نشان میدهد که زمینههای تحقیقاتی و کاربردی هوش مصنوعی به سرعت در حال گسترش است و به همین دلیل نیاز به شفافیت و ساختار در فرآیندهای آموزشی بیشتر احساس میشود.
مراحل کپیسازی
Steps to replication
مراحل تکرار هدف پروژه Open-R1 تکرار مدل R1 در یک بازه چند هفتهای است که بخشی از آن به سرور تحقیقاتی Science Cluster دستاورد هاکینگ فِیس با ۷۶۸ واحد پردازشگر گرافیکی Nvidia H100 وابسته است. مهندسان هاکینگ فِیس قصد دارند از Science Cluster برای ایجاد datasets مشابه دادههایی که DeepSeek برای ساخت R1 استفاده کرده، بهرهبرداری کنند. برای ایجاد یک خط لوله آموزشی، این تیم از جامعه هوش مصنوعی و همچنین سایر حوزههای فناوری درخواست کمک کرده است. این همکاریها در پلتفرمهای هاکینگ فِیس و گیتهاب که پروژه Open-R1 در آنجا میزبانی میشود، انجام میگیرد. از سوی دیگر، فون ورا در گفتگو با TechCrunch گفت: "ما باید اطمینان حاصل کنیم که الگوریتمها و دستور العملها را به درستی پیادهسازی کنیم؛ اما این یک تلاش جمعی است که بهترین راه حلها را به ارمغان میآورد." علاقهمندی زیادی در این زمینه وجود دارد. پروژه Open-R1 تنها در عرض سه روز در گیتهاب ۱۰,۰۰۰ ستاره کسب کرد که این ستارهها به عنوان نشانهای از محبوبیت و کارآمدی پروژه از سوی کاربران گیتهاب عمل میکنند. اگر پروژه Open-R1 موفق باشد، پژوهشگران هوش مصنوعی قادر خواهند بود بر اساس خط لوله آموزشی، نسل بعدی مدلهای استدلال بازمتن را توسعه دهند. باکوش ابراز امیدواری کرد که پروژه Open-R1 نهتنها یک نسخه بازمتن قوی از R1 تولید کند، بلکه پایهای برای بهبود مدلهای آینده نیز فراهم آورد. او در ادامه گفت: "توسعه متنباز نه تنها به نفع همه است، بلکه همچنین به آزمایشگاهها و تأمینکنندگان مدلها این امکان را میدهد که همگی از یک نوآوری مشترک بهرهمند شوند." با وجود اینکه برخی از کارشناسان هوش مصنوعی نگران سوءاستفادههای احتمالی از هوش مصنوعی متن باز هستند، باکوش بر این باور است که فواید این روند بیشتر از خطرات آن است. او تصریح کرد: "زمانی که دستور تهیه R1 تکرار شود، هر کسی که بتواند چند GPU اجاره کند، میتواند نسخهای از R1 با دادههای خود بسازد و این تکنولوژی را به شکل گستردهتری منتشر کند." او همچنین گفت: "ما واقعاً درباره انتشارهای اخیر متنباز که نقش شفافیت را در هوش مصنوعی تقویت میکنند، هیجانزده هستیم. این یک تغییر مهم برای این حوزه است که روایت اینطور تغییر میکند که تنها تعداد محدودی از آزمایشگاهها قادر به پیشرفت هستند و توسعه متنباز عقبمانده است." در نهایت، پروژه Open-R1 میتواند به تقویت همکاری در میان متخصصان و پژوهشگران در زمینه هوش مصنوعی کمک شایانی کند و بهترین شیوهها را برای اشتراکگذاری و گسترش این تکنولوژی در سطح جهانی ایجاد کند.
AI
AI
deepseek
deepseek-r1
Generative AI
Hugging Face
open source
open-r1
r1
reasoning model
پیشنهاد ویژه برای دریافت جدید ترین تحولات هوش مصنوعی
اولین نفری باشید که درباره جدید ترین های هوش مصنوعی، می خوانید!
همین امروز در سایت IWL.IR عضو شوید و از جدیدترین های روز دنیای فن آوری هوش مصنوعی بهرهمند شوید.
عضویت
در درخواست رد، پلتفرم چتبات Character AI ادعا میکند که تحت حفاظت اصلاحیه اول قرار دارد.
شرکت هوش مصنوعی ویروسی دیپسیک خانواده مدلهای تصویری جدیدی معرفی کرد.
آیا ایالتها در تنظیم مقررات هوش مصنوعی پیشگام خواهند بود؟
گروک ۳ بهنظر برای برخی کاربران فعال شده است.
OpenAI اعلام کرد که ممکن است دادههای حذفشده اپراتورها را تا 90 روز ذخیره کند.
کوارتز به آرامی مقالات خبری تولید شده توسط هوش مصنوعی را منتشر میکند.
دیپسیک ادعا میکند که مدل «استدلال» آن در برخی معیارها از o1 اوپنایآی پیشی میگیرد.
سام آلتمن: اوپنای آی در زمینه متن باز در "سمت نادرست تاریخ" بوده است.
دیپ سیکس: همه چیز درباره اپلیکیشن چتبات هوش مصنوعی
تیم MLCommons و Hugging Face همکاری کردند تا دیتاست گستردهای از گفتار برای تحقیقات هوش مصنوعی را منتشر کنند.
تأیید شد: استارتاپ هوش مصنوعی متروپلیس، اوستو (که قبلاً به عنوان انیویژن شناخته میشد) را به ارزش ۱۲۵ میلیون دلار خریداری کرد.
دیپسیک به رتبه یک فروشگاه پلی آمریکا رسید.
براساس گزارش، 85% کاربران موبایل ChatGPT مرد هستند.
چتجیپیتی: همه چیزهایی که باید درباره چتبات هوش مصنوعی بدانید
جدیدترین ویژگی ChatGPT به کاربران امکان میدهد تا ویژگیهایی مانند «گپزن» و «نسل Z» را به آن اختصاص دهند.