Deepseek'in şaşırtıcı derecede ucuz AI modeli endüstri devlerine meydan okuyor. Deepseek V3 için sadece 6 milyon dolarlık eğitim maliyeti iddialarına rağmen, daha yakından bakıldığında çok daha önemli bir yatırım ortaya koyuyor.
Deepseek'in kendi kendini tanıtması: "Merhaba, yaratıldım, böylece herhangi bir şey sorabilir ve sizi şaşırtabilecek bir cevap alabilirsiniz," hırsını vurgular. Bu AI piyasayı önemli ölçüde etkiledi ve özellikle büyük bir NVIDIA stok düşüşüne neden oldu.
%İmgp%resim: ensigame.com
Deepseek V3'ün yenilikçi mimarisi performansının anahtarıdır:
- Çoklu atak tahmini (MTP): aynı anda birden fazla kelimeyi tahmin ederek doğruluğu ve hızı artırır.
- Uzmanların Karışımı (MOE): 256 sinir ağı kullanır, her jeton için sekiz'i etkinleştirir, eğitimi hızlandırır ve performansı artırır.
- Çok Başlı Gizli Dikkat (MLA): Tekrar tekrar anahtar ayrıntıları çıkarır, bilgi kaybını en aza indirir ve nüans anlayışını geliştirir.
%İmgp%resim: ensigame.com
Bununla birlikte, Semanaliz Deepseek'in kapsamlı altyapısını ortaya çıkardı: Birden fazla veri merkezine yayılmış yaklaşık 50.000 NVIDIA Hopper GPU'ları (H800, H100 ve H20 birimleri dahil). Toplam sunucu yatırımının 1,6 milyar dolar olduğu tahmin ediliyor ve operasyonel maliyetler 944 milyon dolara ulaşıyor.
High Flyer'ın bir yan kuruluşu olan Deepseek, veri merkezlerinin sahibi, kontrol ve daha hızlı inovasyon uygulaması sunuyor. Kendi kendini finanse edilen statüsü çevikliği artırır. Yüksek maaşlar (bazı araştırmacılar için yıllık 1,3 milyon doların üzerinde) en iyi Çin yeteneklerini çekiyor.
%İmgp%resim: ensigame.com
6 milyon dolarlık eğitim maliyet talebi, araştırma, arıtma, veri işleme ve altyapı hariç, yalnızca GPU kullanımının öncesi eğitimini temsil eden yanıltıcıdır. Deepseek'in toplam AI yatırımı 500 milyon doları aşıyor. Yalın yapısı verimli yeniliği kolaylaştırır.
%İmgp%resim: ensigame.com
Deepseek'in başarısı, iyi finanse edilen bağımsız bir AI şirketinin potansiyelini sergiliyor. Ancak, "bütçe dostu" anlatısı abartılıdır; Milyarlarca yatırım, teknolojik gelişmeler ve güçlü bir ekip çok önemli faktörlerdir. Buna rağmen, Deepseek'in maliyetleri hala rakipleri önemli ölçüde azaltıyor (örneğin, R1 için 5 milyon dolar, chatgpt4o için 100 milyon dolar).