عضو هیئت مدیره Mistral و سرمایه‌گذار a16z، آنجینی میده، می‌گوید DeepSeek نمی‌تواند عطش GPUs برای AI را کاهش دهد.

عضو هیئت مدیره Mistral و سرمایه‌گذار a16z، آنجینی میده، می‌گوید DeepSeek نمی‌تواند عطش GPUs برای AI را کاهش دهد.

میه‌دا، شریک عمومی آندریسن هورویتز و عضو هیئت مدیره میسترال، شش ماه پیش عملکرد فوق‌العاده DeepSeek را مشاهده کرد.

عضو هیئت مدیره Mistral و سرمایه‌گذار a16z، آنجنی میدها، می‌گوید DeepSeek نمی‌تواند تشنگی GPU برای AI را برطرف کند.

Mistral board member and a16z VC Anjney Midha says DeepSeek won’t stop AI’s GPU hunger

انجنی میدها، شریک عمومی Andreessen Horowitz و عضو هیئت مدیره Mistral، به TechCrunch گفت که شش ماه پیش برای نخستین بار به عملکرد خیره‌کننده DeepSeek پی‌برد. در آن زمان، DeepSeek نسخه دوم Coder را معرفی کرد که در انجام وظایف خاص کدنویسی، با GPT4-Turbo از OpenAI رقابت می‌کرد. طبق گزارشی که سال گذشته منتشر شد، این موضوع DeepSeek را به مسیری هدایت کرد که هر چند ماه یک‌بار مدل‌های بهبود یافته‌ای را ارائه دهد. یکی از این مدل‌ها، R1، یک مدل استدلال منبع باز جدید است که صنعت فناوری را به خاطر ارائه عملکرد استاندارد صنعتی به هزینه‌ای بسیار پایین متحول کرده است.
میدها اشاره می‌کند که با وجود ریزش سهام Nvidia، به این معنا نیست که مدل‌های پایه هوش مصنوعی از هزینه میلیاردی برای تهیه چیپ‌های GPU و ساخت مراکز داده جدید صرف‌نظر خواهند کرد. او بیان می‌کند که در عوض، آن‌ها از قدرت محاسباتی که در دست دارند، بهره‌وری بیشتری خواهند داشت. او به این موضوع اشاره کرد: «زمانی که مردم می‌پرسند، آیا DeepSeek به معنای آن است که تمام آن میلیارد دلار کاملاً غیرضروری است؟ نه، در واقع، بسیار ارزشمند است که آن‌ها بتوانند بهبود کارایی DeepSeek را بررسی کرده و سپس به آن یک میلیارد دلار اختصاص دهند.»
او ادامه می‌دهد: «اکنون می‌توانیم 10 برابر بیشتر از همان توان محاسباتی خروجی بگیریم.» میدها همچنین تأکید می‌کند که Mistral به‌هیچ‌وجه عقب‌تر از رقبا مانند OpenAI و Anthropic نیست، حتی اگر هر یک از آن‌ها میلیاردها دلار بیشتری از Mistral جذب کرده باشند. او به‌ویژه به این نکته اشاره می‌کند که OpenAI به دنبال جذب 40 میلیارد دلار دیگر است.
به گفته او، Mistral به دلیل اپن‌سورس بودنش همچنان می‌تواند با این رقبا رقابت کند. او توضیح می‌دهد که اپن‌سورس به شرکت‌ها این امکان را می‌دهد که از نیروی کار فنی تقریباً رایگان بهره‌برداری کنند، در حالی که رقبای بسته‌سورس باید برای تمام کارها و همچنین قدرت محاسبات هزینه پرداخت کنند. او می‌گوید: «شما به 20 میلیارد دلار نیاز ندارید، فقط به قدرت محاسباتی بیشتر نسبت به هر مدل اپن‌سورس دیگر نیازی دارید.»
میدها در نهایت به سرمایه‌گذاری‌های بیشتر اشاره کرد که Llama، بزرگ‌ترین مدل هوش مصنوعی اپن‌سورس غربی در رقابت با Mistral، جذب خواهد کرد. مارک زاکربرگ، مدیرعامل فیسبوک، روز چهارشنبه اعلام کرد که همچنان قصد دارد در مجموع "صدها میلیارد دلار" روی هوش مصنوعی سرمایه‌گذاری کند و این شامل 60 میلیارد دلار در سال 2025 برای هزینه‌های سرمایه‌ای، عمدتاً مراکز داده خواهد بود. برای اطلاعات بیشتر و تحلیل‌های دقیق‌تر می‌توانید به سایت ما به آدرس iwl.ir مراجعه کنید.

برنامه اشتراک GPU اکسژن a16z "بیش از حد رزرو شده"

a16z’s Oxygen GPU sharing program “overbooked”

برنامه اشتراک‌گذاریGPU اوکسیژن a16z به‌قدری شلوغ شده که میده، که همزمان به‌عنوان عضو هیئت‌مدیره برای نسل‌دهنده تصویر هوش مصنوعی Black Forest Labs و سازنده مدل‌های سه‌بعدی Luma فعالیت می‌کند، دلایل دیگری نیز در این خصوص دارد که با ادامه تقاضا برای GPUها مواجه است. او رهبری برنامه اوکسیژن a16z را بر عهده دارد و اعلام می‌کند که GPUها، به‌ویژه مدل پیشرفته H100 اینوییدیا، به کالای کمیاب و ارزشمندی تبدیل شده‌اند. به همین دلیل این شرکت سرمایه‌گذاری مخاطره‌آمیز حدود یک سال و نیم پیش تصمیم گرفت که تعدادی از این GPUها را خریداری کند تا شرکت‌های موجود در پورتفولیو خود بتوانند از آن‌ها استفاده کنند. میده با خنده می‌گوید: "اکنون برنامه اوکسیژن به‌قدری شلوغ است که نمی‌توانم به‌درستی تخصیص بدهم." استارتاپ‌های او نه تنها به GPUها برای آموزش مدل‌های هوش مصنوعی نیاز دارند، بلکه برای اجرای محصولات هوش مصنوعی خود برای مشتریان نیز به تعداد بیشتری از آن‌ها احتیاج دارند. او توضیح می‌دهد: "اکنون تقاضای سیری‌ناپذیری برای استنتاج و مصرف وجود دارد." به همین دلیل او معتقد است که پیشرفت‌های مهندسی DeepSeek نیز هیچ تغییری در Stargate ایجاد نخواهد کرد که همان همکاری عظیم 500 میلیارد دلاری OpenAI با شرکت‌های SoftBank و Oracle برای مراکز داده هوش مصنوعی است.
مهم‌ترین تغییری که DeepSeek معرفی می‌کند، شناسایی دولت‌ها به‌عنوان زیرساخت پایه‌ای بعدی است که همانند برق و اینترنت حائز اهمیت است. میده به این نکته اشاره می‌کند که کشورهای مختلف باید "استقلال زیرساختی" را مدنظر قرار دهند. آیا آن‌ها می‌خواهند به مدل‌های چینی که شامل سانسور و خطراتی برای داده‌هایشان هستند، وابسته شوند؟ یا اینکه تمایل دارند از مدل‌های غربی استفاده کنند که تابع قوانین و اصول اخلاقی غربی و موافقت‌نامه‌های ناتو هستند؟ او به‌وضوح از کشورهای غربی حمایت می‌کند که از مدل‌های غربی مانند Mistral مستقر در پاریس استفاده کنند. صدها شرکت نگران این موضوع هستند و از قبل به استفاده از DeepSeek، که هم یک اپلیکیشن مصرف‌کننده و هم یک مدل متن‌باز است، پایان داده‌اند. اما همه نگاهی منفی به مدل‌های متن‌باز چینی ندارند. برخی شرکت‌ها این مدل‌ها را به‌صورت محلی در مراکز داده خود اجرا می‌کنند و DeepSeek هم در حال حاضر به‌عنوان یک سرویس ابری امن از شرکت‌های آمریکایی مانند Microsoft Azure Foundry در دسترس است، بنابراین توسعه‌دهندگان نیازی به استفاده از سرویس ابری DeepSeek ندارند. در واقع، پات گلسینگر، مدیرعامل سابق اینتل — که با وضعیت چین آشنایی دارد — به TechCrunch گفت که استارتاپ او Gloo در حال ساخت خدمات چت هوش مصنوعی بر اساس نسخه خود از DeepSeek R1 به‌جای انتخاب‌هایی مانند Llama یا OpenAI است. اما اگر کسی تمایل به کنار گذاشتن برنامه‌های داده‌مرکزی خود در پی DeepSeek داشته باشد، میده با خنده درخواست می‌کند: "اگر GPU اضافی دارید، لطفاً آن‌ها را به Anj ارسال کنید."