OpenAI مدل جدید 'استدلال' خود به نام o3-mini را معرفی کرد.
هوش مصنوعی, Openai آخرین مدل استدلال خود را راه اندازی می کند
OpenAI جمعه یک مدل جدید هوش مصنوعی به نام o3-mini را راهاندازی کرد؛ جدیدترین مدل از خانواده o این شرکت.
OpenAI مدل جدید «استدلال» خود به نام o3-mini را معرفی کرد.
OpenAI launches o3-mini, its latest ‘reasoning’ model
در روز جمعه، OpenAI از مدل جدید هوش مصنوعی خود به نام o3-mini رونمایی کرد که جدیدترین عضو خانواده مدلهای استدلالی این شرکت است. این مدل برای اولین بار در ماه دسامبر به همراه یک سیستم قدرتمندتر به نام o3 معرفی شد. اما راهاندازی این مدل در زمانی حیاتی برای شرکت اتفاق میافتد، زمانی که اهداف و چالشهای OpenAI به نظر هر روز در حال افزایش است. این شرکت در حال مبارزه با این تصور است که در مسابقه هوش مصنوعی به شرکتهای چینی مانند DeepSeek میدان را واگذار کرده است؛ شرکتی که OpenAI ادعا میکند ممکن است مالکیت معنوی آن را دزدیده باشد. OpenAI همچنین در تلاش است تا رابطه خود را با واشنگتن تقویت کند در حالی که به طور همزمان به دنبال اجرای یک پروژه عظیم مرکز داده است و ظاهراً مقدمات یکی از بزرگترین دورهای تأمین مالی تاریخ را فراهم میکند. به این ترتیب، o3-mini وارد صحنه میشود. OpenAI این مدل جدید را به عنوان مدلی "قوی" و "مقرون به صرفه" معرفی کرده است. یک سخنگوی OpenAI به TechCrunch گفت: "راهاندازی امروز، گامی مهم در راستای گسترش دسترسی به هوش مصنوعی پیشرفته به نفع مأموریت ما است." با توجه به پیشرفت های سریع در زمینه فناوری هوش مصنوعی، مهم است که شرکتها در مسیر درست حرکت کنند و به طور همزمان با چالشها و رقابتهای جدید مواجه شوند. در این راستا، پلتفرمهای مانند iwl.ir میتوانند نقش بسزایی در اطلاعرسانی و آموزش به کاربران و توسعهدهندگان در خصوص این تحولات ایفا کنند.
استدلال کارآمدتر
More efficient reasoning
مدلهای استدلالی مانند o3-mini به طور قابل توجهی قبل از ارائه نتایج، خود را تأیید میکنند. این ویژگی کمک میکند تا از مشکلاتی که معمولاً مدلها با آن مواجه میشوند، جلوگیری شود. اگرچه این مدلها کمی بیشتر زمان میبرند تا به پاسخها برسند، اما در عوض در حوزههایی مانند فیزیک بیشتر مطمئن و البته نه کاملاً بینقص عمل میکنند. مدل o3-mini به طور خاص برای مسائل STEM شامل برنامهنویسی، ریاضیات و علوم بهینهسازی شده است. به ادعای OpenAI، این مدل در مقایسه با خانواده o1 (o1 و o1-mini) از لحاظ قابلیتها تقریباً در یک سطح قرار دارد، اما سریعتر و ارزانتر عمل میکند. بر اساس ادعای شرکت، تستکنندگان خارجی بیش از نیمی از زمانها به پاسخهای o3-mini نسبت به o1-mini ترجیح دادهاند. در تستهای A/B، این مدل ۳۹ درصد کمتر اشتباهات "بزرگ" در "سؤالات واقعی سخت" داشت و پاسخهایی "شفافتر" را با سرعتی تقریباً ۲۴ درصد سریعتر ارائه داد. o3-mini از روز جمعه برای تمام کاربران از طریق ChatGPT در دسترس خواهد بود، اما کاربران در طرحهای ChatGPT Plus و Team که هزینه میپردازند، محدودیت بالاتری با ۱۵۰ پرسش در روز دریافت خواهند کرد. مشترکین ChatGPT Pro به دسترسی نامحدود دسترسی خواهند داشت و o3-mini در هفته آینده به مشتریان ChatGPT Enterprise و ChatGPT Edu ارائه میشود. کاربران با طرحهای پریمیوم میتوانند با استفاده از منوی کشویی ChatGPT، مدل o3-mini را انتخاب کنند. کاربران رایگان میتوانند با کلیک بر روی دکمه جدید "Reason" در نوار چت، یا با درخواست از ChatGPT برای "تولید مجدد" یک پاسخ، از این مدل بهرهمند شوند. از روز جمعه، o3-mini همچنین از طریق API OpenAI به تعدادی از توسعهدهندگان عرضه میشود، هرچند در ابتدا از تجزیه و تحلیل تصاویر پشتیبانی نخواهد کرد. توسعهدهندگان میتوانند سطح "تلاش در استدلال" (کم، متوسط یا بالا) را انتخاب کنند تا o3-mini با توجه به نیازهای خود به طور عمیقتر تفکر کند. قیمت o3-mini معادل ۰.۵۵ دلار برای هر میلیون توکن ورودی کشف شده و ۴.۴۰ دلار برای هر میلیون توکن خروجی است. این هزینه ۶۳ درصد کمتر از قیمت o1-mini است و با قیمتگذاری مدل استدلال R1 از DeepSeek رقابت میکند. OpenAI اعلام کرده است که در ChatGPT، o3-mini با سطح تلاش استدلال متوسط تنظیم شده است که به ادعای این شرکت، تعادل خوبی بین سرعت و دقت ارائه میدهد. کاربران هزینهپرداز گزینه انتخاب "o3-mini-high" را در انتخاب مدل خواهند داشت که "هوش بالاتری" را به عوض پاسخهای کندتر ارائه میدهد. صرفنظر از مدلی که کاربران ChatGPT انتخاب میکنند، این مدل با جستجو همکاری خواهد کرد تا پاسخهای بروز را با لینک به منابع وب مرتبط پیدا کند. OpenAI هشدار میدهد که این قابلیت یک "پروتوتایپ" است و در تلاش برای ادغام جستجو در مدلهای استدلالی خود میباشد. آنها بیان کردند: "اگرچه o1 مدل استدلال عمومیتری است، o3-mini یک گزینه تخصصی برای حوزههای فنی نیازمند دقت و سرعت را فراهم میآورد." انتشار o3-mini مرحله دیگری از مأموریت OpenAI در راستای پیشبرد مرزهای هوش مقرون به صرفه است.
هشدارها در همه جا وجود دارد
Caveats abound
مدل O3-mini که به تازگی معرفی شده است، بهعنوان یکی از مدلهای هوش مصنوعی، نمیتوان آن را قویترین مدل تولید شده توسط OpenAI دانست. این مدل در برخی معیارها از مدل Reasoning R1 ساخت DeepSeek عقبتر است، هرچند در تست AIME 2024 که توانایی فهم و پاسخ به دستورات پیچیده را ارزیابی میکند، O3-mini توانست بر R1 برتری یابد، اما این موفقیت تنها با تلاش عقلانی بالا امکانپذیر بود. همچنین O3-mini در تست SWE-bench Verified که تمرکزش بر برنامهنویسی است، با اختلاف ۰.۱ نمره از R1 پیشی گرفت، اما باز هم به زحمت و تلاش عقلانی بالا نیاز داشت. در زمینه تلاش عقلانی پایینتر، O3-mini نتوانست از R1 در تست GPQA Diamond که سوالات سطح دکتری در فیزیک، زیستشناسی و شیمی را بررسی میکند، جلوتر باشد. به طور منصفانه، باید گفت که O3-mini توانایی پاسخگویی به بسیاری از سوالات را با هزینه و زمان پاسخدهی رقابتی پایین دارد. OpenAI در مقایسه با خانواده o1، اشاره میکند که “در تلاش عقلانی کم، عملکرد O3-mini مشابه o1-mini است و در تلاش متوسط، عملکرد O3-mini به o1 نزدیک میشود.” همچنین O3-mini در تلاش عقلانی متوسط در زمینههای ریاضی، برنامهنویسی و علوم، عملکردی مشابه با o1 دارد و پاسخها را سریعتر ارائه میکند. نکته جالب اینجاست که برتری O3-mini نسبت به o1 در برخی زمینهها ناچیز است؛ بهطور مثال، در AIME 2024، O3-mini تنها با ۰.۳ درصد نمره بیشتر از o1 در تلاش عقلانی بالا قرار دارد. همچنین در تست GPQA Diamond، O3-mini حتی با تلاش عقلانی بالا هم نتوانست از نمره o1 پیشی بگیرد. OpenAI ادعا میکند که O3-mini بهعنوان یک مدل "ایمن" یا حتی ایمنتر از خانواده o1 عمل میکند، که این به لطف تلاشهای تیم قرمز (red-teaming) و روششناسی "همراستایی تأملی" است که باعث میشود مدلها در حین پاسخ دادن به سوالات، ایمنی OpenAI را در نظر بگیرند. بر اساس ادعای این شرکت، O3-mini در ارزیابیهای چالشبرانگیز ایمنی و دور زدن، بهطور قابلتوجهی از یکی از مدلهای پرچمدار OpenAI یعنی GPT-4o پیشی میگیرد. دنیای هوش مصنوعی به سرعت در حال تغییر است و هر روز با معرفی مدلهای جدید و پیشرفتهتر، تواناییها و امکانات بیشتری به کاربران ارائه میشود. این تحولات بهخصوص در عرصههای مختلف دانش و فناوری تأثیرگذار بوده و نویدبخش آیندهای روشن برای این حوزهاند.
AI
AI
ChatGPT
Generative AI
o3-mini
OpenAI
reasoning model
پیشنهاد ویژه برای دریافت جدید ترین تحولات هوش مصنوعی
اولین نفری باشید که درباره جدید ترین های هوش مصنوعی، می خوانید!
همین امروز در سایت IWL.IR عضو شوید و از جدیدترین های روز دنیای فن آوری هوش مصنوعی بهرهمند شوید.
عضویت
محققان هگینگ فیس در تلاشند نسخهای بازتر از مدل «استدلال» هوش مصنوعی DeepSeek را بسازند.
آزمایش هوش مصنوعی با ایجاد پرش توپها در اشکال چرخشی
تأیید شد: استارتاپ هوش مصنوعی متروپلیس، اوستو (که قبلاً به عنوان انیویژن شناخته میشد) را به ارزش ۱۲۵ میلیون دلار خریداری کرد.
گزارش: سافتبانک در گفتگو برای سرمایهگذاری تا ۲۵ میلیارد دلار در اوپنایآی
تنش محققان به خاطر سرعت رشد صنعت هوش مصنوعی
دیپسیک ادعا میکند که مدل «استدلال» آن در برخی معیارها از o1 اوپنایآی پیشی میگیرد.
«ورتیس ۵۰ میلیون دلار برای پلتفرم هزینه SaaS با هوش مصنوعی جذب کرد»
«عاملهای هوش مصنوعی ممکن است نخستین تکشاخ یک نفره را بهوجود آورند — اما هزینه اجتماعی آن چیست؟»
DeepSeek، اپلیکیشن برتر فروشگاه اپل، جایگزین ChatGPT شد.
نتیجهگیری یک پژوهش: هوش مصنوعی در تاریخ ضعیف عمل میکند.
سام آلتمن: اوپنای آی در زمینه متن باز در "سمت نادرست تاریخ" بوده است.
براساس گزارش، 85% کاربران موبایل ChatGPT مرد هستند.
عضو هیئت مدیره Mistral و سرمایهگذار a16z، آنجینی میده، میگوید DeepSeek نمیتواند عطش GPUs برای AI را کاهش دهد.
OpenAI اعلام کرد که ممکن است دادههای حذفشده اپراتورها را تا 90 روز ذخیره کند.
جدیدترین ویژگی ChatGPT به کاربران امکان میدهد تا ویژگیهایی مانند «گپزن» و «نسل Z» را به آن اختصاص دهند.