شرکت ادوبی به دلیل استفاده نادرست از آثار نویسندگان در آموزش هوش مصنوعی، با اقدام کلاسی پیشنهادی مواجه شد

شرکت ادوبی به دلیل استفاده نادرست از آثار نویسندگان در آموزش هوش مصنوعی، با اقدام کلاسی پیشنهادی مواجه شد

مانند تقریباً هر شرکت فناوری دیگری که وجود دارد، Adobe نیز در چند سال گذشته به شدت به هوش مصنوعی متمایل شده است. این شرکت نرم‌افزاری از سال 2023 تعدادی خدمات مختلف هوش مصنوعی را راه‌اندازی کرده است، از جمله Firefly - مجموعه تولید رسانه‌های مبتنی بر هوش مصنوعی. با این حال، اکنون، استقبال کامل این شرکت از این فناوری ممکن است منجر به مشکلاتی شده باشد، زیرا یک شکایت جدید ادعا می کند که از کتاب های دزدی دریایی برای آموزش یکی از مدل های هوش مصنوعی خود استفاده کرده است.

شرکت ادوبی به دلیل استفاده نادرست از آثار نویسندگان در آموزش هوش مصنوعی، با اقدام کلاسی پیشنهادی مواجه شد

Adobe hit with proposed class-action, accused of misusing authors’ work in AI training

مانند تقریباً هر شرکت فناوری دیگری که وجود دارد، Adobe نیز در چند سال گذشته به شدت به هوش مصنوعی متمایل شده است. این شرکت نرم‌افزاری از سال 2023 تعدادی خدمات مختلف هوش مصنوعی را راه‌اندازی کرده است، از جمله Firefly - مجموعه تولید رسانه‌های مبتنی بر هوش مصنوعی. با این حال، اکنون، استقبال کامل این شرکت از این فناوری ممکن است منجر به مشکلاتی شده باشد، زیرا یک شکایت جدید ادعا می کند که از کتاب های دزدی دریایی برای آموزش یکی از مدل های هوش مصنوعی خود استفاده کرده است. یک طرح دعوی حقوقی پیشنهادی از طرف الیزابت لیون، نویسنده ای از اورگان، ادعا می کند که ادوبی از نسخه های غیرقانونی کتاب های متعدد - از جمله کتاب خودش - برای آموزش برنامه SlimLM شرکت استفاده کرده است. Adobe SlimLM را به عنوان یک سری مدل زبان کوچک توصیف می کند که می تواند "برای کارهای کمک اسناد در دستگاه های تلفن همراه بهینه شود." این بیان می‌کند که SlimLM روی SlimPajama-627B، یک «داده‌داده متن‌باز، تکراری، چند سازمانی» که توسط Cerebras در ژوئن 2023 منتشر شد، از قبل آموزش دیده بود. لیون، که تعدادی کتاب راهنما برای نوشتن غیرداستانی نوشته است، می‌گوید که برخی از آثار او در مجموعه داده‌های پیش‌آموزشی گنجانده شده‌اند. شکایت لیون، که در ابتدا توسط رویترز گزارش شده بود، می‌گوید که نوشته‌های او در زیرمجموعه‌ای از مجموعه داده‌های دستکاری‌شده که اساس برنامه Adobe بود، گنجانده شده است: «مجموعه داده SlimPajama با کپی و دستکاری مجموعه داده RedPajama (از جمله کپی کردن Books3) ایجاد شد. بنابراین، از آنجایی که SlimPajama یک کپی مشتق از مجموعه داده RedPajama است، شامل مجموعه داده Books3، از جمله آثار دارای حق چاپ شاکی و اعضای کلاس است. "Books3" - مجموعه ای عظیم از 191000 کتاب که برای آموزش سیستم های GenAI استفاده شده است - منبع دائمی مشکلات قانونی برای جامعه فناوری بوده است. RedPajama همچنین در تعدادی از پرونده های قضایی مورد استناد قرار گرفته است. در ماه سپتامبر، یک شکایت علیه اپل ادعا کرد که این شرکت از مطالب دارای حق چاپ برای آموزش مدل هوشمند اپل استفاده کرده است. دعوای قضایی به مجموعه داده اشاره کرد و شرکت فناوری را به کپی برداری از آثار محافظت شده "بدون رضایت و بدون اعتبار یا غرامت" متهم کرد. در ماه اکتبر، یک شکایت مشابه علیه Salesforce همچنین ادعا کرد که این شرکت از RedPajama برای اهداف آموزشی استفاده کرده است. متأسفانه برای صنعت فناوری، چنین دعاوی حقوقی تا حدودی عادی شده است. الگوریتم‌های هوش مصنوعی بر روی مجموعه‌های داده عظیم آموزش داده می‌شوند و در برخی موارد، گفته می‌شود که این مجموعه‌های داده شامل مواد دزدی دریایی هستند. در سپتامبر، Anthropic موافقت کرد که 1.5 میلیارد دلار به تعدادی از نویسندگانی که از آن شکایت کرده بودند و آن را متهم به استفاده از نسخه های غیرقانونی کارشان برای آموزش ربات چت خود، Claude کرده بودند، بپردازد. این پرونده یک نقطه عطف بالقوه در نبردهای حقوقی جاری بر سر مطالب دارای حق چاپ در داده های آموزشی هوش مصنوعی در نظر گرفته شد که تعداد زیادی از آنها وجود دارد.