محققان رقیب متن‌باز مدل «استدلال» OpenAI با هزینه زیر 50 دلار ساختند.

هوش مصنوعی, محققان رقیب باز برای مدل استدلال Openais O1 برای ز

طبق تحقیق جدیدی که جمعه گذشته منتشر شد، محققان هوش مصنوعی در استنفورد و دانشگاه واشنگتن موفق به آموزش مدل "استدلال" هوش مصنوعی با هزینه کمتر از 50 دلار در اعتبار محاسباتی ابری شدند.

محققان رقیب رایگان مدل 'استدلال' اوپن‌ای‌آی o1 را با هزینه‌ای کمتر از ۵۰ دلار ساختند.

Researchers created an open rival to OpenAI’s o1 ‘reasoning’ model for under $50

محققان هوش مصنوعی در دانشگاه‌های استنفورد و واشنگتن توانستند یک مدل “استدلال” هوش مصنوعی به نام s1 را تنها با هزینه‌ای کمتر از ۵۰ دلار در اعتبار محاسبات ابری آموزش دهند. طبق تحقیق جدیدی که روز جمعه منتشر شد، این مدل عملکردی مشابه با مدل‌های پیشرفته استدلال مانند o1 اوپن‌ای‌آی و R1 دیپ‌سیک دارد و می‌تواند توانایی‌های ریاضی و برنامه‌نویسی را اندازه‌گیری کند. مدل s1 به وسیله یک مدل پایه تجاری ایجاد شده و تیم تحقیقاتی با استفاده از فرایند تصفیه، آن را بهبود داده است. فرایند تصفیه شامل استخراج توانمندی‌های استدلال از یک مدل هوش مصنوعی دیگر با آموزش بر اساس پاسخ‌های آن می‌باشد. محققان تاکید کردند که s1 از یکی از مدل‌های استدلال گوگل، یعنی Gemini 2.0 Flash Thinking Experimental، تصفیه شده است.
یکی از جنبه‌های جالب این تحقیق این است که این تیم به دنبال ساده‌ترین رویکرد برای دستیابی به عملکرد استدلال قوی و افزایش زمان تفکر مدل قبل از پاسخ دادن به سوالات بود. محققان همچنین نشان دادند که مدل‌های استدلال را می‌توان با استفاده از یک مجموعه داده نسبتاً کوچک از طریق یک فرایند به نام "تنظیم دقیق نظارت شده" (SFT) تصفیه کرد، که در آن یک مدل هوش مصنوعی به صورت صریح instructed می‌شود تا رفتارهای خاصی را در یک مجموعه داده تقلید کند.
در سال ۲۰۲۵، شرکت‌های متا، گوگل و مایکروسافت برنامه‌ریزی کرده‌اند تا صدها میلیارد دلار در زیرساخت‌های هوش مصنوعی سرمایه‌گذاری کنند که بخشی از آن به آموزش مدل‌های نسل بعدی هوش مصنوعی اختصاص خواهد یافت. به نظر می‌رسد که این سطح از سرمایه‌گذاری برای پیشبرد نوآوری در زمینه هوش مصنوعی همچنان ضروری باشد. در این میان، نگرانی‌هایی درباره تجاری‌سازی مدل‌های هوش مصنوعی وجود دارد، به طوری که اگر کسی بتواند یک مدل چندمیلیون‌دلاری را با هزینه‌ای اندک بازتولید کند، مرزهای رقابت تا چه حد امکان‌پذیر خواهد بود.
مدل s1 به سادگی و با استفاده از مجموعه داده‌ای متشکل از ۱۰۰۰ سوال دقیقاً طراحی شده و پاسخ‌های مربوط به آن‌ها آموزش داده شده است. محققان برای بهبود عملکرد مدل، از ترفندهایی مثل افزودن کلمه “صبر کن” در زمان استدلال s1 استفاده کردند و این کار به مدل کمک کرد تا پاسخ‌های دقیق‌تری ارائه کند. به نظر می‌رسد که این تحقیق در وب‌سایت ما 'iwl.ir' به عنوان یک نقطه عطف در دنیای هوش مصنوعی به شمار می‌رود و نشان می‌دهد که با هزینه‌های کم، می‌توان به پیشرفت‌های قابل توجهی در این حوزه دست یافت.

AI
AI reasoning models
AI research
deepseek
distillation
OpenAI
TC