استفاده از این ساب‌ردیت توسط OpenAI برای آزمایش توانایی اقناع هوش مصنوعی

استفاده از این ساب‌ردیت توسط OpenAI برای آزمایش توانایی اقناع هوش مصنوعی

OpenAI برای اندازه‌گیری قدرت Persuasion مدل‌های استدلال هوش مصنوعی خود از زیرمجموعه r/ChangeMyView استفاده کرد و این را در یک کارت سیستم منتشر کرد.

OpenAI از این ساب‌ردیت برای آزمایش اقناع هوش مصنوعی استفاده کرد

OpenAI used this subreddit to test AI persuasion

OpenAI از این ساب‌ردیت برای آزمایش اقناع هوش مصنوعی استفاده کرد - OpenAI used this subreddit to test AI persuasion

OpenAI از ساب‌ردیت r/ChangeMyView برای ایجاد آزمونی به منظور اندازه‌گیری قابلیت‌های اقناعی مدل‌های استدلال هوش مصنوعی خود استفاده کرده است. این شرکت این اطلاعات را در یک کارت سیستمی منتشر کرد — مدرکی که نحوه کارکرد یک سیستم هوش مصنوعی را توضیح می‌دهد — که همزمان با مدل جدید "استدلال" خود، یعنی o3-mini، در روز جمعه منتشر شد. میلیون‌ها کاربر ردیت عضو r/ChangeMyView هستند، جایی که آنها نظرات خود را ثبت می‌کنند و امیدوارند درباره‌ی دیدگاه‌های مختلف در مورد یک موضوع بیشتر بیاموزند. در پاسخ به این نظرات، کاربران دیگر با استدلال‌های قانع‌کننده‌ای توضیح می‌دهند که چرا نظر اولیه اشتباه است.
این ساب‌ردیت یکی از بسیاری از فرومی‌های ردیت است که برای شرکت‌های فناوری مثل OpenAI به عنوان منبعی ارزشمند به شمار می‌رود که می‌خواهند مدل‌های هوش مصنوعی خود را با داده‌های انسانی با کیفیت آموزش دهند. OpenAI اعلام کرده است که پست‌های کاربران از r/ChangeMyView را جمع‌آوری کرده و از مدل‌های هوش مصنوعی خود می‌خواهد که در یک محیط کنترل‌شده پاسخ‌هایی بنویسند که بتوانند نظر کاربر ردیت را در مورد یک موضوع تغییر دهند. سپس این پاسخ‌ها به ارزیابان نشان داده می‌شود تا مشخص شود که چقدر استدلال قانع‌کننده است و نهایتاً OpenAI پاسخ‌های مدل‌های هوش مصنوعی را با پاسخ‌های انسانی برای همان پست مقایسه می‌کند.
OpenAI قراردادی با ردیت برای صدور مجوز محتوا دارد که به این شرکت اجازه می‌دهد از پست‌های کاربران ردیت برای آموزش مدل‌های خود استفاده کند و این پست‌ها را در محصولات خود نمایش دهد. جزئیات مقدار پرداختی OpenAI برای این محتوا هنوز مشخص نیست، اما گزارش‌ها نشان می‌دهد که گوگل سالانه 60 میلیون دلار به ردیت تحت قراردادی مشابه پرداخت می‌کند. با این حال، OpenAI به TechCrunch اعلام کرده است که ارزیابی مبتنی بر ChangeMyView ارتباطی با قرارداد خود با ردیت ندارد. نحوه دسترسی OpenAI به داده‌های این ساب‌ردیت مشخص نیست و این شرکت برنامه‌ای برای انتشار این ارزیابی به عموم ندارد.
در حالی که معیار ChangeMyView OpenAI جدید نیست — زیرا برای ارزیابی o1 نیز استفاده شده است — اما نشان می‌دهد که داده‌های انسانی تا چه اندازه برای توسعه‌دهندگان مدل‌های هوش مصنوعی ارزشمند هستند و همچنین روش‌های تیره‌ای که شرکت‌های فناوری برای به دست آوردن مجموعه داده‌ها استفاده می‌کنند. ردیت به درخواست TechCrunch برای اظهارنظر فوراً پاسخ نداد. در حالی که ردیت چند قرارداد صدور مجوز هوش مصنوعی امضا کرده است، این شرکت همچنین چندین شرکت هوش مصنوعی را به دلیل جمع‌آوری داده‌ها از سایت خود بدون پرداخت هزینه، مورد انتقاد قرار داده است.
مدیرعامل ردیت، استیو هافمن، سال گذشته به ورج گفته بود که مایکروسافت، انتروپیک و پرپلکسی از مذاکره با او خودداری کرده‌اند و گفت که جلوگیری از این شرکت‌ها "واقعاً دردسرساز" بوده است. نکته جالب اینجاست که OpenAI در چندین شکایت متهم به جمع‌آوری غیرمجاز وب‌سایت‌ها، از جمله نیویورک تایمز، برای بهبود ChatGPT و مدل‌های هوش مصنوعی زیرین خود شده است.
در مورد عملکرد o3-mini در معیار ChangeMyView، به نظر نمی‌رسد که این مدل به طور قابل توجهی بهتر یا بدتر از o1 یا GPT-4o عمل کند. با این حال، به نظر می‌رسد که مدل‌های هوش مصنوعی جدید OpenAI قانع‌کننده‌تر از بیشتر کاربران در ساب‌ردیت r/ChangeMyView هستند. OpenAI در کارت سیستمی o3-mini اعلام کرد: "GPT-4o، o3-mini و o1 همگی توانمندی‌های قوی در استدلال قانع‌کننده نشان می‌دهند، که در 80 تا 90 درصد برتر انسان‌ها قرار دارند." "در حال حاضر، ما شاهد عملکردی فراتر از انسان‌ها یا کارایی فوق‌انسانی نیستیم."
هدف OpenAI این نیست که مدل‌های هوش مصنوعی فوق‌العاده قانع‌کننده ایجاد کند، بلکه اطمینان حاصل کند که مدل‌ها بیش از حد قانع‌کننده نمی‌شوند. مدل‌های استدلال به طور قابل توجهی در اقناع و فریب بهبود یافته‌اند، بنابراین OpenAI ارزیابی‌ها و تدابیر جدیدی برای رسیدگی به این موضوع توسعه داده است. ترس از این آزمون‌های اقناعی این است که یک مدل هوش مصنوعی اگر بسیار خوب در قانع کردن کاربران انسانی عمل کند، خطرناک خواهد بود. تئوریکالاً، این می‌تواند به یک هوش مصنوعی پیشرفته اجازه دهد تا به دنبال اهداف خود یا اهداف کسانی که بر آن کنترل دارند، باشد. حتی پس از جمع‌آوری بیشتر اینترنت عمومی و گذراندن مراحل برای صدور مجوز داده‌های دیگر، معیار ChangeMyView نشان می‌دهد که توسعه‌دهندگان مدل‌های هوش مصنوعی همچنان در یافتن مجموعه داده‌های با کیفیت برای آزمایش مدل‌های خود دچار مشکل هستند. اما به دست آوردن این داده‌ها آسان‌تر از آن چیزی است که به نظر می‌رسد. برای دریافت آخرین اخبار و مقالات مرتبط با فناوری‌های برتر، می‌توانید به وب‌سایت ما، iwl.ir، مراجعه کنید.