Ang nakakagulat na Deepseek ay murang mga hamon sa modelo ng AI na mga higante sa industriya. Sa kabila ng mga pag -angkin ng isang $ 6 milyong gastos sa pagsasanay para sa Deepseek V3, ang isang mas malapit na hitsura ay nagpapakita ng isang mas malaking pamumuhunan.
Ang pagpapakilala sa sarili ni Deepseek: "Kumusta, nilikha ako upang maaari kang magtanong ng anuman at makakuha ng isang sagot na maaaring sorpresa ka," i-highlight ang ambisyon nito. Ang AI na ito ay makabuluhang nakakaapekto sa merkado, kapansin -pansin na nagiging sanhi ng isang pangunahing pagbagsak ng stock ng NVIDIA.
Imahe: ensigame.com
Ang makabagong arkitektura ng Deepseek V3 ay susi sa pagganap nito:
- Multi-Token Prediction (MTP): Hinuhulaan ng maraming mga salita nang sabay-sabay, pagpapalakas ng kawastuhan at bilis.
- Paghahalo ng mga eksperto (MOE): Gumagamit ng 256 Neural Networks, pag -activate ng walong para sa bawat token, pabilis na pagsasanay at pagpapabuti ng pagganap.
- Multi-head Latent pansin (MLA): Paulit-ulit na kinukuha ang mga pangunahing detalye, pag-minimize ng pagkawala ng impormasyon at pagpapahusay ng pag-unawa sa nuance.
Imahe: ensigame.com
Gayunpaman, ang semianalysis ay nagsiwalat ng malawak na imprastraktura ng Deepseek: humigit -kumulang na 50,000 nvidia hopper GPUs (kabilang ang H800, H100, at H20 unit) na kumalat sa maraming mga sentro ng data. Ang kabuuang pamumuhunan ng server ay tinatayang $ 1.6 bilyon, na may mga gastos sa pagpapatakbo na umaabot sa $ 944 milyon.
Ang DeepSeek, isang subsidiary ng high-flyer, ay nagmamay-ari ng mga sentro ng data nito, na nag-aalok ng kontrol at mas mabilis na pagpapatupad ng pagbabago. Ang katayuan na pinondohan ng sarili ay nagpapabuti ng liksi. Ang mataas na suweldo (higit sa $ 1.3 milyon taun -taon para sa ilang mga mananaliksik) ay nakakaakit ng nangungunang talento ng Tsino.
Imahe: ensigame.com
Ang $ 6 milyong paghahabol sa gastos sa pagsasanay ay nakaliligaw, na kumakatawan lamang sa paggamit ng pre-training GPU, hindi kasama ang pananaliksik, pagpipino, pagproseso ng data, at imprastraktura. Ang kabuuang pamumuhunan ng Deepseek ay higit sa $ 500 milyon. Ang sandalan na istraktura nito ay nagpapadali ng mahusay na pagbabago.
Imahe: ensigame.com
Ang tagumpay ng Deepseek ay nagpapakita ng potensyal ng isang mahusay na pinondohan na independiyenteng kumpanya ng AI. Gayunpaman, ang "badyet-friendly" na salaysay nito ay pinalaki; Bilyun -bilyon sa pamumuhunan, pagsulong sa teknolohiya, at isang malakas na koponan ay mahalagang mga kadahilanan. Sa kabila nito, ang mga gastos sa Deepseek ay makabuluhang sumailalim sa mga kakumpitensya (hal., $ 5 milyon para sa R1 kumpara sa $ 100 milyon para sa ChatGPT4O).