OpenAI مدل جدید 'استدلال' خود به نام o3-mini را معرفی کرد.

OpenAI مدل جدید 'استدلال' خود به نام o3-mini را معرفی کرد.

OpenAI جمعه یک مدل جدید هوش مصنوعی به نام o3-mini را راه‌اندازی کرد؛ جدیدترین مدل از خانواده o این شرکت.

OpenAI مدل جدید «استدلال» خود به نام o3-mini را معرفی کرد.

OpenAI launches o3-mini, its latest ‘reasoning’ model

در روز جمعه، OpenAI از مدل جدید هوش مصنوعی خود به نام o3-mini رونمایی کرد که جدیدترین عضو خانواده مدل‌های استدلالی این شرکت است. این مدل برای اولین بار در ماه دسامبر به همراه یک سیستم قدرتمندتر به نام o3 معرفی شد. اما راه‌اندازی این مدل در زمانی حیاتی برای شرکت اتفاق می‌افتد، زمانی که اهداف و چالش‌های OpenAI به نظر هر روز در حال افزایش است. این شرکت در حال مبارزه با این تصور است که در مسابقه هوش مصنوعی به شرکت‌های چینی مانند DeepSeek میدان را واگذار کرده است؛ شرکتی که OpenAI ادعا می‌کند ممکن است مالکیت معنوی آن را دزدیده باشد.
OpenAI همچنین در تلاش است تا رابطه خود را با واشنگتن تقویت کند در حالی که به طور همزمان به دنبال اجرای یک پروژه عظیم مرکز داده است و ظاهراً مقدمات یکی از بزرگترین دورهای تأمین مالی تاریخ را فراهم می‌کند. به این ترتیب، o3-mini وارد صحنه می‌شود. OpenAI این مدل جدید را به عنوان مدلی "قوی" و "مقرون به صرفه" معرفی کرده است. یک سخنگوی OpenAI به TechCrunch گفت: "راه‌اندازی امروز، گامی مهم در راستای گسترش دسترسی به هوش مصنوعی پیشرفته به نفع مأموریت ما است."
با توجه به پیشرفت های سریع در زمینه فناوری هوش مصنوعی، مهم است که شرکت‌ها در مسیر درست حرکت کنند و به طور همزمان با چالش‌ها و رقابت‌های جدید مواجه شوند. در این راستا، پلتفرم‌های مانند iwl.ir می‌توانند نقش بسزایی در اطلاع‌رسانی و آموزش به کاربران و توسعه‌دهندگان در خصوص این تحولات ایفا کنند.

استدلال کارآمدتر

More efficient reasoning

مدل‌های استدلالی مانند o3-mini به طور قابل توجهی قبل از ارائه نتایج، خود را تأیید می‌کنند. این ویژگی کمک می‌کند تا از مشکلاتی که معمولاً مدل‌ها با آن مواجه می‌شوند، جلوگیری شود. اگرچه این مدل‌ها کمی بیشتر زمان می‌برند تا به پاسخ‌ها برسند، اما در عوض در حوزه‌هایی مانند فیزیک بیشتر مطمئن و البته نه کاملاً بی‌نقص عمل می‌کنند.
مدل o3-mini به طور خاص برای مسائل STEM شامل برنامه‌نویسی، ریاضیات و علوم بهینه‌سازی شده است. به ادعای OpenAI، این مدل در مقایسه با خانواده o1 (o1 و o1-mini) از لحاظ قابلیت‌ها تقریباً در یک سطح قرار دارد، اما سریع‌تر و ارزان‌تر عمل می‌کند. بر اساس ادعای شرکت، تست‌کنندگان خارجی بیش از نیمی از زمان‌ها به پاسخ‌های o3-mini نسبت به o1-mini ترجیح داده‌اند.
در تست‌های A/B، این مدل ۳۹ درصد کمتر اشتباهات "بزرگ" در "سؤالات واقعی سخت" داشت و پاسخ‌هایی "شفاف‌تر" را با سرعتی تقریباً ۲۴ درصد سریع‌تر ارائه داد. o3-mini از روز جمعه برای تمام کاربران از طریق ChatGPT در دسترس خواهد بود، اما کاربران در طرح‌های ChatGPT Plus و Team که هزینه می‌پردازند، محدودیت بالاتری با ۱۵۰ پرسش در روز دریافت خواهند کرد. مشترکین ChatGPT Pro به دسترسی نامحدود دسترسی خواهند داشت و o3-mini در هفته آینده به مشتریان ChatGPT Enterprise و ChatGPT Edu ارائه می‌شود.
کاربران با طرح‌های پریمیوم می‌توانند با استفاده از منوی کشویی ChatGPT، مدل o3-mini را انتخاب کنند. کاربران رایگان می‌توانند با کلیک بر روی دکمه جدید "Reason" در نوار چت، یا با درخواست از ChatGPT برای "تولید مجدد" یک پاسخ، از این مدل بهره‌مند شوند.
از روز جمعه، o3-mini همچنین از طریق API OpenAI به تعدادی از توسعه‌دهندگان عرضه می‌شود، هرچند در ابتدا از تجزیه و تحلیل تصاویر پشتیبانی نخواهد کرد. توسعه‌دهندگان می‌توانند سطح "تلاش در استدلال" (کم، متوسط یا بالا) را انتخاب کنند تا o3-mini با توجه به نیازهای خود به طور عمیق‌تر تفکر کند.
قیمت o3-mini معادل ۰.۵۵ دلار برای هر میلیون توکن ورودی کشف شده و ۴.۴۰ دلار برای هر میلیون توکن خروجی است. این هزینه ۶۳ درصد کمتر از قیمت o1-mini است و با قیمت‌گذاری مدل استدلال R1 از DeepSeek رقابت می‌کند.
OpenAI اعلام کرده است که در ChatGPT، o3-mini با سطح تلاش استدلال متوسط تنظیم شده است که به ادعای این شرکت، تعادل خوبی بین سرعت و دقت ارائه می‌دهد. کاربران هزینه‌پرداز گزینه انتخاب "o3-mini-high" را در انتخاب مدل خواهند داشت که "هوش بالاتری" را به عوض پاسخ‌های کندتر ارائه می‌دهد.
صرف‌نظر از مدلی که کاربران ChatGPT انتخاب می‌کنند، این مدل با جستجو همکاری خواهد کرد تا پاسخ‌های بروز را با لینک به منابع وب مرتبط پیدا کند. OpenAI هشدار می‌دهد که این قابلیت یک "پروتوتایپ" است و در تلاش برای ادغام جستجو در مدل‌های استدلالی خود می‌باشد. آن‌ها بیان کردند: "اگرچه o1 مدل استدلال عمومی‌تری است، o3-mini یک گزینه تخصصی برای حوزه‌های فنی نیازمند دقت و سرعت را فراهم می‌آورد." انتشار o3-mini مرحله دیگری از مأموریت OpenAI در راستای پیشبرد مرزهای هوش مقرون به صرفه است.

هشدارها در همه جا وجود دارد

Caveats abound

مدل O3-mini که به تازگی معرفی شده است، به‌عنوان یکی از مدل‌های هوش مصنوعی، نمی‌توان آن را قوی‌ترین مدل تولید شده توسط OpenAI دانست. این مدل در برخی معیارها از مدل Reasoning R1 ساخت DeepSeek عقب‌تر است، هرچند در تست AIME 2024 که توانایی فهم و پاسخ به دستورات پیچیده را ارزیابی می‌کند، O3-mini توانست بر R1 برتری یابد، اما این موفقیت تنها با تلاش عقلانی بالا امکان‌پذیر بود. همچنین O3-mini در تست SWE-bench Verified که تمرکزش بر برنامه‌نویسی است، با اختلاف ۰.۱ نمره از R1 پیشی گرفت، اما باز هم به زحمت و تلاش عقلانی بالا نیاز داشت.
در زمینه تلاش عقلانی پایین‌تر، O3-mini نتوانست از R1 در تست GPQA Diamond که سوالات سطح دکتری در فیزیک، زیست‌شناسی و شیمی را بررسی می‌کند، جلوتر باشد. به طور منصفانه، باید گفت که O3-mini توانایی پاسخگویی به بسیاری از سوالات را با هزینه و زمان پاسخ‌دهی رقابتی پایین دارد. OpenAI در مقایسه با خانواده o1، اشاره می‌کند که “در تلاش عقلانی کم، عملکرد O3-mini مشابه o1-mini است و در تلاش متوسط، عملکرد O3-mini به o1 نزدیک می‌شود.” همچنین O3-mini در تلاش عقلانی متوسط در زمینه‌های ریاضی، برنامه‌نویسی و علوم، عملکردی مشابه با o1 دارد و پاسخ‌ها را سریع‌تر ارائه می‌کند.
نکته جالب اینجاست که برتری O3-mini نسبت به o1 در برخی زمینه‌ها ناچیز است؛ به‌طور مثال، در AIME 2024، O3-mini تنها با ۰.۳ درصد نمره بیشتر از o1 در تلاش عقلانی بالا قرار دارد. همچنین در تست GPQA Diamond، O3-mini حتی با تلاش عقلانی بالا هم نتوانست از نمره o1 پیشی بگیرد.
OpenAI ادعا می‌کند که O3-mini به‌عنوان یک مدل "ایمن" یا حتی ایمن‌تر از خانواده o1 عمل می‌کند، که این به لطف تلاش‌های تیم قرمز (red-teaming) و روش‌شناسی "هم‌راستایی تأملی" است که باعث می‌شود مدل‌ها در حین پاسخ دادن به سوالات، ایمنی OpenAI را در نظر بگیرند. بر اساس ادعای این شرکت، O3-mini در ارزیابی‌های چالش‌برانگیز ایمنی و دور زدن، به‌طور قابل‌توجهی از یکی از مدل‌های پرچم‌دار OpenAI یعنی GPT-4o پیشی می‌گیرد.
دنیای هوش مصنوعی به سرعت در حال تغییر است و هر روز با معرفی مدل‌های جدید و پیشرفته‌تر، توانایی‌ها و امکانات بیشتری به کاربران ارائه می‌شود. این تحولات به‌خصوص در عرصه‌های مختلف دانش و فناوری تأثیرگذار بوده و نویدبخش آینده‌ای روشن برای این حوزه‌اند.

پیشنهاد ویژه برای دریافت جدید ترین تحولات هوش مصنوعی

اولین نفری باشید که درباره جدید ترین های هوش مصنوعی، می خوانید!
همین امروز در سایت IWL.IR عضو شوید و از جدیدترین های روز دنیای فن آوری هوش مصنوعی بهره‌مند شوید.