Deepseek's verrassend goedkope AI -model daagt reuzen uit de industrie uit. Ondanks claims van slechts $ 6 miljoen trainingskosten voor Deepseek V3, onthult een nadere blik een veel meer substantiële investering.
Deepseek's zelfintroductie: "Hallo, ik ben gemaakt zodat je alles kunt vragen en een antwoord kunt krijgen dat je zelfs zou kunnen verrassen", benadrukt de ambitie. Deze AI heeft de markt aanzienlijk beïnvloed, wat met name een grote daling van de NVIDIA -aandelen veroorzaakt.
afbeelding: ensigame.com
De innovatieve architectuur van Deepseek V3 is de sleutel tot de prestaties:
- Multi-Token Prediction (MTP): voorspelt meerdere woorden tegelijkertijd, waardoor de nauwkeurigheid en snelheid verhogen.
- Mix van experts (MOE): gebruikt 256 neurale netwerken, activeren acht voor elk token, versnellende training en verbetering van de prestaties.
- Multi-head latente aandacht (MLA): Herhaaldelijk extraheert belangrijke details, het minimaliseren van informatieverlies en het verbeteren van nuance-begrip.
afbeelding: ensigame.com
Semianyse onthulde echter de uitgebreide infrastructuur van Deepseek: ongeveer 50.000 Nvidia Hopper GPU's (inclusief H800-, H100- en H20 -eenheden) verspreidde zich over meerdere datacenters. De totale serverinvestering wordt geschat op $ 1,6 miljard, met operationele kosten van $ 944 miljoen.
Deepseek, een dochteronderneming van High-Flyer, bezit zijn datacenters en biedt controle en snellere innovatie-implementatie. Zijn zelf gefinancierde status verbetert de behendigheid. Hoge salarissen (jaarlijks meer dan $ 1,3 miljoen voor sommige onderzoekers) trekken top Chinees talent aan.
afbeelding: ensigame.com
De trainingskostenclaim van $ 6 miljoen is misleidend, wat alleen PRPU-gebruik voor de training vertegenwoordigt, exclusief onderzoek, verfijning, gegevensverwerking en infrastructuur. De totale AI -investering van Deepseek overtreft $ 500 miljoen. De magere structuur vergemakkelijkt efficiënte innovatie.
afbeelding: ensigame.com
Het succes van Deepseek toont het potentieel van een goed gefinancierd onafhankelijk AI-bedrijf. Het "budgetvriendelijke" verhaal is echter overdreven; Miljarden aan investeringen, technologische vooruitgang en een sterk team zijn cruciale factoren. Desondanks zijn de kosten van DeepSeek nog steeds aanzienlijk ondermijnen (bijvoorbeeld $ 5 miljoen voor R1 versus $ 100 miljoen voor chatgpt4o).