محققان رقیب رایگان مدل 'استدلال' اوپنایآی o1 را با هزینهای کمتر از ۵۰ دلار ساختند.
Researchers created an open rival to OpenAI’s o1 ‘reasoning’ model for under $50
محققان هوش مصنوعی در دانشگاههای استنفورد و واشنگتن توانستند یک مدل “استدلال” هوش مصنوعی به نام s1 را تنها با هزینهای کمتر از ۵۰ دلار در اعتبار محاسبات ابری آموزش دهند. طبق تحقیق جدیدی که روز جمعه منتشر شد، این مدل عملکردی مشابه با مدلهای پیشرفته استدلال مانند o1 اوپنایآی و R1 دیپسیک دارد و میتواند تواناییهای ریاضی و برنامهنویسی را اندازهگیری کند. مدل s1 به وسیله یک مدل پایه تجاری ایجاد شده و تیم تحقیقاتی با استفاده از فرایند تصفیه، آن را بهبود داده است. فرایند تصفیه شامل استخراج توانمندیهای استدلال از یک مدل هوش مصنوعی دیگر با آموزش بر اساس پاسخهای آن میباشد. محققان تاکید کردند که s1 از یکی از مدلهای استدلال گوگل، یعنی Gemini 2.0 Flash Thinking Experimental، تصفیه شده است.
یکی از جنبههای جالب این تحقیق این است که این تیم به دنبال سادهترین رویکرد برای دستیابی به عملکرد استدلال قوی و افزایش زمان تفکر مدل قبل از پاسخ دادن به سوالات بود. محققان همچنین نشان دادند که مدلهای استدلال را میتوان با استفاده از یک مجموعه داده نسبتاً کوچک از طریق یک فرایند به نام "تنظیم دقیق نظارت شده" (SFT) تصفیه کرد، که در آن یک مدل هوش مصنوعی به صورت صریح instructed میشود تا رفتارهای خاصی را در یک مجموعه داده تقلید کند.
در سال ۲۰۲۵، شرکتهای متا، گوگل و مایکروسافت برنامهریزی کردهاند تا صدها میلیارد دلار در زیرساختهای هوش مصنوعی سرمایهگذاری کنند که بخشی از آن به آموزش مدلهای نسل بعدی هوش مصنوعی اختصاص خواهد یافت. به نظر میرسد که این سطح از سرمایهگذاری برای پیشبرد نوآوری در زمینه هوش مصنوعی همچنان ضروری باشد. در این میان، نگرانیهایی درباره تجاریسازی مدلهای هوش مصنوعی وجود دارد، به طوری که اگر کسی بتواند یک مدل چندمیلیوندلاری را با هزینهای اندک بازتولید کند، مرزهای رقابت تا چه حد امکانپذیر خواهد بود.
مدل s1 به سادگی و با استفاده از مجموعه دادهای متشکل از ۱۰۰۰ سوال دقیقاً طراحی شده و پاسخهای مربوط به آنها آموزش داده شده است. محققان برای بهبود عملکرد مدل، از ترفندهایی مثل افزودن کلمه “صبر کن” در زمان استدلال s1 استفاده کردند و این کار به مدل کمک کرد تا پاسخهای دقیقتری ارائه کند. به نظر میرسد که این تحقیق در وبسایت ما 'iwl.ir' به عنوان یک نقطه عطف در دنیای هوش مصنوعی به شمار میرود و نشان میدهد که با هزینههای کم، میتوان به پیشرفتهای قابل توجهی در این حوزه دست یافت.
- AI
- AI reasoning models
- AI research
- deepseek
- distillation
- OpenAI
- TC