Lemon Slice 10.5 میلیون دلار از YC و Matrix دریافت می کند تا فناوری آواتار دیجیتال خود را بسازد.

Lemon Slice 10.5 میلیون دلار از YC و Matrix دریافت می کند تا فناوری آواتار دیجیتال خود را بسازد.

توسعه دهندگان و شرکت ها به طور فزاینده ای عوامل هوش مصنوعی و ربات های چت را در برنامه های خود مستقر می کنند، اما تا کنون بیشتر به متن محدود شده اند. شرکت تولید آواتار دیجیتال Lemon Slice در حال کار برای افزودن یک لایه ویدیویی به آن چت‌ها با یک مدل انتشار جدید است که می‌تواند آواتارهای دیجیتال را از یک تصویر ایجاد کند.

Lemon Slice 10.5 میلیون دلار از YC و Matrix دریافت می کند تا فناوری آواتار دیجیتال خود را بسازد.

Lemon Slice nabs $10.5M from YC and Matrix to build out its digital avatar tech

توسعه دهندگان و شرکت ها به طور فزاینده ای عوامل هوش مصنوعی و ربات های چت را در برنامه های خود مستقر می کنند، اما تا کنون بیشتر به متن محدود شده اند. شرکت تولید آواتار دیجیتال Lemon Slice در حال کار برای افزودن یک لایه ویدیویی به آن چت‌ها با یک مدل انتشار جدید است که می‌تواند آواتارهای دیجیتال را از یک تصویر ایجاد کند. این مدل که Lemon Slice-2 نامیده می‌شود، می‌تواند یک آواتار دیجیتالی ایجاد کند که در بالای یک پایگاه دانش کار می‌کند تا هر نقشی را که برای عامل هوش مصنوعی لازم است، مانند رسیدگی به سؤالات مشتری، کمک به سؤالات تکالیف، یا حتی کار به عنوان یک عامل پشتیبانی سلامت روان، ایفا کند. لینا کولوچی، یکی از بنیانگذاران من، گفت: "در روزهای اولیه GenAI، هم بنیانگذاران من شروع به بازی با مدل های مختلف ویدیو کردند، و برای ما آشکار شد که ویدیو تعاملی خواهد بود. بخش قانع کننده در مورد ابزارهایی مانند ChatGPT این بود که آنها تعاملی بودند و ما می خواهیم ویدیو دارای این لایه باشد." Lemon Slice می‌گوید این یک مدل 20 میلیارد پارامتری است که می‌تواند روی یک GPU برای پخش زنده ویدیوها با سرعت 20 فریم در ثانیه کار کند. این شرکت این مدل را از طریق یک API و یک ویجت قابل جاسازی در دسترس قرار می دهد که شرکت ها می توانند با یک خط کد در سایت های خود ادغام کنند. پس از ایجاد آواتار، می‌توانید پس‌زمینه، استایل و ظاهر یک شخصیت را در هر نقطه تغییر دهید. علاوه بر آواتارهای شبیه انسان، این شرکت همچنین بر توانایی تولید شخصیت‌های غیرانسانی متناسب با نیازهای مختلف تمرکز کرده است. این استارتاپ از فناوری ElevenLabs برای تولید صدای این آواتارها استفاده می کند. لیمون اسلایس که توسط لینا کولوچی، سیدنی پریماس و اندرو ویتز در سال 2024 تأسیس شد، شرط می‌بندد که استفاده از مدل انتشار همه‌منظوره خودش (نوعی مدل مولد که یاد می‌گیرد به عقب از داده‌های آموزشی پر سر و صدا برای تولید داده‌های جدید کار کند) برای ساخت آواتار، آن را از رقبا متمایز می‌کند. کولوچی گفت: «راه‌حل‌های آواتار موجود که تا به امروز دیده‌ام، ارزش منفی به محصول می‌افزاید. "آنها خزنده هستند و سفت هستند. برای چند ثانیه خوب به نظر می رسند، و به محض اینکه شما شروع به تعامل با آنها می کنید، احساس بسیار عجیب و غریبی می کنید، و شما را راحت نمی کند. چیزی که جلوی آواتارها را گرفته است این است که آنها به اندازه کافی خوب نبوده اند." برای تأمین مالی این تلاش، این شرکت روز سه‌شنبه اعلام کرد که 10.5 میلیون دلار سرمایه اولیه را از Matrix Partners، Y Combinator، آرش فردوسی CTO Dropbox، مدیر عامل Twitch، Emmett Shear، و The Chainsmokers جمع‌آوری کرده است. این شرکت می‌گوید برای جلوگیری از شبیه‌سازی غیرمجاز چهره یا صدا، نرده‌های محافظ در نظر گرفته است و از مدل‌های زبان بزرگ برای تعدیل محتوا استفاده می‌کند. Lemon Slice سازمان هایی را که از فناوری خود استفاده می کنند نام نمی برد، اما گفت که این مدل برای مواردی مانند آموزش، یادگیری زبان، تجارت الکترونیک و آموزش شرکتی به کار گرفته شده است. این استارت‌آپ با رقابت سختی از سوی استارت‌آپ‌های تولید ویدئو مانند D-ID، HeyGen، و Sythesia، و همچنین دیگر سازندگان آواتار دیجیتال Genies، Soul Machine، Praktika و AvatarOS مواجه است. ایلیا سوخار، شریک ماتریکس، فکر می‌کند که آواتارها در مناطقی که ویدیوها برجسته هستند مفید خواهند بود. به عنوان مثال، مردم دوست دارند از یوتیوب بیاموزند تا بلاک های طولانی متن را بخوانند. او خاطرنشان کرد که توانایی فنی Lemon Slice و توانایی های خود آن را نسبت به دیگر استارت آپ ها برتری می دهد. او گفت: "این یک تیم کاملاً فنی با سابقه ارسال محصولات ML است، نه فقط دموها و تحقیقات. بسیاری از بازیکنان دیگر برای سناریوها یا عمودهای خاص سفارشی شده اند، و Lemon Slice رویکرد مقیاس بندی "درس تلخ" تعمیم یافته (داده ها و محاسبات) را در پیش گرفته است که در سایر روش های هوش مصنوعی کار کرده است." جارد فریدمن از Y-Combinator معتقد است که استفاده از یک مدل به سبک انتشار به Lemon Slice اجازه می‌دهد تا هر نوع آواتار را در مقایسه با برخی استارت‌آپ‌های دیگر که بر روی آواتارهای انسان‌مانند یا شخصیت‌های بازی متمرکز هستند، تولید کند. "به عقیده من، Lemon Slice تنها شرکتی است که رویکرد بنیادی ML را اتخاذ می کند که در نهایت می تواند بر دره عجیب و غریب غلبه کند و تست تورینگ آواتار را بشکند. آنها همان مدلی را مانند Veo3 یا Sora آموزش می دهند: یک ترانسفورماتور انتشار ویدئو.  چون یک مدل همه منظوره است که تمام کارها را به خوبی انجام می دهد. همچنین برای چهره‌های انسانی و غیرانسانی کار می‌کند و برای افزودن یک چهره جدید فقط به یک تصویر نیاز دارد.» این استارت آپ در حال حاضر هشت کارمند دارد و قصد دارد از این بودجه برای استخدام نیروی مهندسی و کارمندان بازار استفاده کند، همراه با پرداخت قبوض محاسباتی برای آموزش مدل های خود.