ابزار عامل OpenAI ممکن است به زودی منتشر شود
OpenAI’s agent tool may be nearing release
به نظر میرسد OpenAI به زودی ابزاری هوش مصنوعی را معرفی کند که قادر است کنترل کامپیوتر شما را به دست گیرد و اقداماتی را به نمایندگی از شما انجام دهد. تیبور بلاهو، مهندس نرمافزار معروف به افشای دقیق محصولات هوش مصنوعی، ادعا کرده که شواهدی از ابزار بهقولمعروف "اپراتور" OpenAI کشف کرده است. سایتهای خبری از جمله بلومبرگ پیشتر در مورد اپراتور گزارشی منتشر کردهاند که این سیستم را به عنوان سیستمی "عاملی" توصیف کردهاند که قادر به مدیریت خودکار وظایفی مانند نوشتن کد و رزرو سفر است. بر اساس گزارشی از The Information، OpenAI در حال هدفگذاری بر روی ماه ژانویه برای انتشار اپراتور است. کدی که بلاهو در این آخر هفته کشف کرده، به این گزارش اعتبار بیشتری میبخشد. بر اساس گفتههای بلاهو، اپلیکیشن ChatGPT برای macOS گزینههای مخفیای برای تعریف میانبرهایی به نامهای "Toggle Operator" و "Force Quit Operator" به دست آورده است. افزون بر این، بلاهو بیان کرده که OpenAI نیز ارجاعات مربوط به اپراتور را در وبسایت خود اضافه کرده است، هرچند که این مواد هنوز بهطور عمومی قابل مشاهده نیستند.
بلاهو همچنین اشاره کرده که سایت OpenAI جداولی هنوز منتشر نشده را شامل مقایسه عملکرد اپراتور با دیگر سیستمهای هوش مصنوعی در حال استفاده قرار داده است. اگرچه این جداول ممکن است جایگزینهایی باشند، اما اگر اعداد دقیق باشند، نشاندهنده این هستند که اپراتور در انجام برخی از وظایف صد درصد قابل اعتماد نیست. وبسایت OpenAI پیش از این ارجاعات به اپراتور/OpenAI CUA (عاملی برای استفاده از کامپیوتر) را شامل "جدول کارت سیستم اپراتور"، "جدول ارزیابی تحقیق اپراتور" و "جدول نرخ عدم پذیرش اپراتور" قرار داده است.
در یک مقایسه بر روی OSWorld، "OpenAI Computer Use Agent (CUA)" — که احتمال میرود مدل هوش مصنوعی قدرتدهنده اپراتور باشد — امتیاز ۳۸.۱٪ را به دست آورده است که جلوتر از مدل کنترل کامپیوتر Anthropic است، اما به میزان ۷۲.۴٪ که انسانها به دست میآورند، فاصله زیادی دارد. OpenAI CUA در WebVoyager عملکرد بهتری نسبت به انسانها داشته است، که توانایی یک هوش مصنوعی را در پیمایش و تعامل با وبسایتها ارزیابی میکند. اما بر اساس آزمونهای منتشر شده، این مدل در مقیاس دیگری یعنی WebArena امتیاز کمتر از ویژگیهای انسانی را دارد. اپراتور همچنین در انجام وظایفی که انسانها به راحتی میتوانند انجام دهند، با مشکل مواجه میشود. برای مثال، در آزمایشی که از اپراتور خواسته شد تا با یک ارائهدهنده خدمات ابری ثبتنام کند و یک ماشین مجازی راهاندازی کند، تنها موفق به انجام ۶۰٪ از ماموریتها شد. همچنین، هنگامی که از آن خواسته شد تا یک کیف پول بیتکوین ایجاد کند، تنها در ۱۰٪ از موارد موفق بود.
این اقدامات OpenAI نشاندهنده ورود قریبالوقوع این شرکت به دنیای عوامل هوش مصنوعی است، در حالی که رقبایی نظیر Anthropic و گوگل نیز در حال تلاش برای تصاحب این بخش نوظهور هستند. با توجه به تحقیقاتی از شرکت Markets and Markets، بازار عوامل هوش مصنوعی میتواند تا سال ۲۰۳۰ به ارزشی معادل ۴۷.۱ میلیارد دلار برسد. در حال حاضر، عوامل هوش مصنوعی هنوز نسبتاً ابتدایی هستند، اما برخی کارشناسان نگران ایمنی آنها هستند، به ویژه با توجه به اینکه ممکن است فناوری بهسرعت بهبود یابد. یکی از جداول منتشر شده نشان میدهد که اپراتور در ارزیابیهای ایمنی منتخب عملکرد خوبی داشته و قادر به جلوگیری از انجام "فعالیتهای غیرقانونی" و جستجوی "دادههای شخصی حساس" بوده است. گزارشها حاکی از آن است که آزمایشهای ایمنی یکی از دلایل چرخه طولانی توسعه اپراتور بوده است. در یک پست اخیر در X، Wojciech Zaremba، یکی از بنیانگذاران OpenAI، Anthropic را به خاطر انتشار یک عامل بدون تدابیر ایمنی انتقاد کرده است. به نوعی میتوان گفت، باید توجه داشت که OpenAI با انتقاداتی از سوی محققان هوش مصنوعی، از جمله کارکنان قبلی خود مواجه شده است که به کاهش تمرکز بر روی کارهای ایمنی به نفع تجاریسازی سریع فناوریاش اشاره کردهاند. برای اطلاعات بیشتر در خصوص این فناوری و به روزرسانیهای آن، میتوانید به وبسایت iwl.ir مراجعه کنید.
- agents
- AI
- AI
- Apps
- Generative AI
- Leak
- OpenAI
- operator
- rumor