OpenAI اکنون فرآیند تفکر مدل o3-mini خود را بیشتر آشکار میکند.
OpenAI now reveals more of its o3-mini model’s thought process

در پاسخ به فشار رقبایی مانند شرکت چینی دیپسیک، اوپنایآی در حال تغییر نحوه ارتباط مدل جدید هوش مصنوعی خود به نام o3-mini است که فرآیند "تفکر" خود را مرحله به مرحله بیان میکند. در روز پنجشنبه، اوپنایآی اعلام کرد که کاربران رایگان و پرداختی ChatGPT، پلتفرم چتبات هوش مصنوعی این شرکت، از یک "زنجیره تفکر" بهروزرسانی شده بهرهمند خواهند شد که مراحل "استدلال" مدل و نحوه رسیدن آن به پاسخها را به شکل واضحتری نمایش میدهد. مشترکین طرحهای پریمیوم ChatGPT که از o3-mini در پیکربندی "استدلال بالا" استفاده میکنند نیز این بهروزرسانی را مشاهده خواهند کرد.
به گفته یک سخنگوی اوپنایآی، "ما یک [زنجیره تفکر] بهروز شده برای o3-mini معرفی میکنیم که هدف آن آسانتر کردن درک نحوه تفکر مدل برای کاربران است." وی افزود: "با این بهروزرسانی، شما قادر خواهید بود فرآیند استدلال مدل را دنبال کنید و این امر به شما وضوح و اطمینان بیشتری در پاسخهای آن میدهد." مدلهای استدلالی مانند o3-mini قبل از ارائه نتایج، بهطور کامل خود را بررسی میکنند که این موضوع به آنها کمک میکند از برخی مشکلاتی که معمولاً مدلها با آنها مواجه میشوند، اجتناب کنند. قابل ذکر است که مدلهای استدلالی معمولاً زمان بیشتری برای رسیدن به راهحلها صرف میکنند، به طور معمول چند ثانیه تا چند دقیقه.
مدل R1 دیپسیک، که یک مدل "استدلالی" مشابه o3-mini است، فرآیند تفکر کامل خود را افشا میکند، که بسیاری از پژوهشگران هوش مصنوعی آن را روش ترجیحی میدانند. علاوه بر آسانتر کردن مطالعه مدل، مراحل استدلال در برخی موقعیتها تجربه کاربری بهتری ارائه میدهند و کمک میکنند تا مشخص شود که مدل ممکن است در مسیر درست یا نادرست قرار داشته باشد.
اوپنایآی به دلیل دلایل رقابتی، تصمیم گرفت که مراحل کامل استدلال o3-mini و نسخههای قبلی آن یعنی o1 و o1-mini را نشان ندهد و در عوض کاربران تنها خلاصههایی از مراحل استدلال را مشاهده میکردند که گاهی اوقات نادرست بودند. هنوز هم اوپنایآی مراحل استدلال کامل o3-mini را نشان نمیدهد، اما این شرکت اعلام کرد که "تعادل" را پیدا کرده است: o3-mini میتواند "آزادانه فکر کند" و سپس "افکار" خود را به خلاصههای دقیقتری سازماندهی کند.
بهگفته سخنگوی اوپنایآی، "برای بهبود وضوح و ایمنی، ما یک مرحله پردازش پس از آن اضافه کردهایم که در آن مدل زنجیره تفکر خام را بررسی میکند و هر محتوای ناایمن را حذف کرده و سپس هر ایده پیچیده را ساده میسازد." این مرحله پردازش پس از آن همچنین به کاربران غیرانگلیسی کمک میکند تا زنجیره تفکر را به زبان مادری خود دریافت کنند و تجربهای قابل دسترس و دوستانهتر فراهم سازند.
در یک جلسه پرسش و پاسخ در ردیت هفته پیش، کِوین وایل، رئیس محصولات اوپنایآی، به این تغییر اشاره کرد و گفت: "ما در حال کار بر روی نشان دادن موارد بیشتری هستیم - [نشان دادن فرآیند تفکر مدل] خیلی، خیلی زود خواهد بود." وی افزود: "تعیین دقیق همه چیز در دست بررسی است - نمایش تمام زنجیره تفکر منجر به تقطیر رقابتی میشود، اما ما همچنین میدانیم که مردم (حداقل کاربران قدرتی) این را میخواهند، بنابراین راه صحیحی برای متعادل کردن این موضوع پیدا خواهیم کرد." برای اطلاعات بیشتر درباره این تغییرات و نقش هوش مصنوعی در آینده، میتوانید به سایت ما به آدرس iwl.ir مراجعه کنید.
- AI
- AI
- AI reasoning models
- Apps
- chain of thought
- ChatGPT
- o3-mini
- OpenAI
- reasoning models