- هوش مصنوعی, عضو هیئت مدیره MISTRAL و A16Z VC Anjney Midha می گ
میهدا، شریک عمومی آندریسن هورویتز و عضو هیئت مدیره میسترال، شش ماه پیش عملکرد فوقالعاده DeepSeek را مشاهده کرد.
عضو هیئت مدیره Mistral و سرمایهگذار a16z، آنجنی میدها، میگوید DeepSeek نمیتواند تشنگی GPU برای AI را برطرف کند.
Mistral board member and a16z VC Anjney Midha says DeepSeek won’t stop AI’s GPU hunger
انجنی میدها، شریک عمومی Andreessen Horowitz و عضو هیئت مدیره Mistral، به TechCrunch گفت که شش ماه پیش برای نخستین بار به عملکرد خیرهکننده DeepSeek پیبرد. در آن زمان، DeepSeek نسخه دوم Coder را معرفی کرد که در انجام وظایف خاص کدنویسی، با GPT4-Turbo از OpenAI رقابت میکرد. طبق گزارشی که سال گذشته منتشر شد، این موضوع DeepSeek را به مسیری هدایت کرد که هر چند ماه یکبار مدلهای بهبود یافتهای را ارائه دهد. یکی از این مدلها، R1، یک مدل استدلال منبع باز جدید است که صنعت فناوری را به خاطر ارائه عملکرد استاندارد صنعتی به هزینهای بسیار پایین متحول کرده است.
میدها اشاره میکند که با وجود ریزش سهام Nvidia، به این معنا نیست که مدلهای پایه هوش مصنوعی از هزینه میلیاردی برای تهیه چیپهای GPU و ساخت مراکز داده جدید صرفنظر خواهند کرد. او بیان میکند که در عوض، آنها از قدرت محاسباتی که در دست دارند، بهرهوری بیشتری خواهند داشت. او به این موضوع اشاره کرد: «زمانی که مردم میپرسند، آیا DeepSeek به معنای آن است که تمام آن میلیارد دلار کاملاً غیرضروری است؟ نه، در واقع، بسیار ارزشمند است که آنها بتوانند بهبود کارایی DeepSeek را بررسی کرده و سپس به آن یک میلیارد دلار اختصاص دهند.»
او ادامه میدهد: «اکنون میتوانیم 10 برابر بیشتر از همان توان محاسباتی خروجی بگیریم.» میدها همچنین تأکید میکند که Mistral بههیچوجه عقبتر از رقبا مانند OpenAI و Anthropic نیست، حتی اگر هر یک از آنها میلیاردها دلار بیشتری از Mistral جذب کرده باشند. او بهویژه به این نکته اشاره میکند که OpenAI به دنبال جذب 40 میلیارد دلار دیگر است.
به گفته او، Mistral به دلیل اپنسورس بودنش همچنان میتواند با این رقبا رقابت کند. او توضیح میدهد که اپنسورس به شرکتها این امکان را میدهد که از نیروی کار فنی تقریباً رایگان بهرهبرداری کنند، در حالی که رقبای بستهسورس باید برای تمام کارها و همچنین قدرت محاسبات هزینه پرداخت کنند. او میگوید: «شما به 20 میلیارد دلار نیاز ندارید، فقط به قدرت محاسباتی بیشتر نسبت به هر مدل اپنسورس دیگر نیازی دارید.»
میدها در نهایت به سرمایهگذاریهای بیشتر اشاره کرد که Llama، بزرگترین مدل هوش مصنوعی اپنسورس غربی در رقابت با Mistral، جذب خواهد کرد. مارک زاکربرگ، مدیرعامل فیسبوک، روز چهارشنبه اعلام کرد که همچنان قصد دارد در مجموع "صدها میلیارد دلار" روی هوش مصنوعی سرمایهگذاری کند و این شامل 60 میلیارد دلار در سال 2025 برای هزینههای سرمایهای، عمدتاً مراکز داده خواهد بود. برای اطلاعات بیشتر و تحلیلهای دقیقتر میتوانید به سایت ما به آدرس iwl.ir مراجعه کنید.
برنامه اشتراک GPU اکسژن a16z "بیش از حد رزرو شده"
a16z’s Oxygen GPU sharing program “overbooked”
برنامه اشتراکگذاریGPU اوکسیژن a16z بهقدری شلوغ شده که میده، که همزمان بهعنوان عضو هیئتمدیره برای نسلدهنده تصویر هوش مصنوعی Black Forest Labs و سازنده مدلهای سهبعدی Luma فعالیت میکند، دلایل دیگری نیز در این خصوص دارد که با ادامه تقاضا برای GPUها مواجه است. او رهبری برنامه اوکسیژن a16z را بر عهده دارد و اعلام میکند که GPUها، بهویژه مدل پیشرفته H100 اینوییدیا، به کالای کمیاب و ارزشمندی تبدیل شدهاند. به همین دلیل این شرکت سرمایهگذاری مخاطرهآمیز حدود یک سال و نیم پیش تصمیم گرفت که تعدادی از این GPUها را خریداری کند تا شرکتهای موجود در پورتفولیو خود بتوانند از آنها استفاده کنند. میده با خنده میگوید: "اکنون برنامه اوکسیژن بهقدری شلوغ است که نمیتوانم بهدرستی تخصیص بدهم." استارتاپهای او نه تنها به GPUها برای آموزش مدلهای هوش مصنوعی نیاز دارند، بلکه برای اجرای محصولات هوش مصنوعی خود برای مشتریان نیز به تعداد بیشتری از آنها احتیاج دارند. او توضیح میدهد: "اکنون تقاضای سیریناپذیری برای استنتاج و مصرف وجود دارد." به همین دلیل او معتقد است که پیشرفتهای مهندسی DeepSeek نیز هیچ تغییری در Stargate ایجاد نخواهد کرد که همان همکاری عظیم 500 میلیارد دلاری OpenAI با شرکتهای SoftBank و Oracle برای مراکز داده هوش مصنوعی است.
مهمترین تغییری که DeepSeek معرفی میکند، شناسایی دولتها بهعنوان زیرساخت پایهای بعدی است که همانند برق و اینترنت حائز اهمیت است. میده به این نکته اشاره میکند که کشورهای مختلف باید "استقلال زیرساختی" را مدنظر قرار دهند. آیا آنها میخواهند به مدلهای چینی که شامل سانسور و خطراتی برای دادههایشان هستند، وابسته شوند؟ یا اینکه تمایل دارند از مدلهای غربی استفاده کنند که تابع قوانین و اصول اخلاقی غربی و موافقتنامههای ناتو هستند؟ او بهوضوح از کشورهای غربی حمایت میکند که از مدلهای غربی مانند Mistral مستقر در پاریس استفاده کنند. صدها شرکت نگران این موضوع هستند و از قبل به استفاده از DeepSeek، که هم یک اپلیکیشن مصرفکننده و هم یک مدل متنباز است، پایان دادهاند. اما همه نگاهی منفی به مدلهای متنباز چینی ندارند. برخی شرکتها این مدلها را بهصورت محلی در مراکز داده خود اجرا میکنند و DeepSeek هم در حال حاضر بهعنوان یک سرویس ابری امن از شرکتهای آمریکایی مانند Microsoft Azure Foundry در دسترس است، بنابراین توسعهدهندگان نیازی به استفاده از سرویس ابری DeepSeek ندارند. در واقع، پات گلسینگر، مدیرعامل سابق اینتل — که با وضعیت چین آشنایی دارد — به TechCrunch گفت که استارتاپ او Gloo در حال ساخت خدمات چت هوش مصنوعی بر اساس نسخه خود از DeepSeek R1 بهجای انتخابهایی مانند Llama یا OpenAI است. اما اگر کسی تمایل به کنار گذاشتن برنامههای دادهمرکزی خود در پی DeepSeek داشته باشد، میده با خنده درخواست میکند: "اگر GPU اضافی دارید، لطفاً آنها را به Anj ارسال کنید."
- AI
- Andreessen Horowitz
- Anjney Midha
- deepseek
- Llama
- mistral
- open source ai
- TC