Il modello AI sorprendentemente economico di Deepseek sfida i giganti del settore. Nonostante le affermazioni di un costo di formazione di soli 6 milioni di dollari per DeepSeek V3, uno sguardo più attento rivela un investimento molto più sostanziale.
L'autointroduzione di Deepseek: "Ciao, sono stato creato in modo da poter chiedere qualsiasi cosa e ottenere una risposta che potrebbe persino sorprenderti", mette in evidenza la sua ambizione. Questa intelligenza artificiale ha influenzato in modo significativo il mercato, causando in particolare un importante calo delle azioni Nvidia.
Immagine: Ensigame.com
L'architettura innovativa di Deepseek V3 è la chiave per le sue prestazioni:
- Previsione multi-token (MTP): prevede contemporaneamente più parole, aumentando l'accuratezza e la velocità.
- Miscela di esperti (MOE): impiega 256 reti neurali, attivando otto per ogni token, accelerando la formazione e migliorando le prestazioni.
- Attenzione latente multi-testa (MLA): estrae ripetutamente i dettagli chiave, minimizzando la perdita di informazioni e migliorando la comprensione della sfumatura.
Immagine: Ensigame.com
Tuttavia, la semianalisi ha rivelato la vasta infrastruttura di DeepSeek: circa 50.000 GPU della tramoggia Nvidia (comprese le unità H800, H100 e H20) si sono diffuse su più data center. L'investimento totale del server è stimato a $ 1,6 miliardi, con costi operativi che raggiungono $ 944 milioni.
DeepSeek, una consociata di High-Flyer, possiede i suoi data center, offrendo un controllo e un'implementazione più rapida dell'innovazione. Il suo stato autofinanziato migliora l'agilità. Gli alti salari (oltre $ 1,3 milioni all'anno per alcuni ricercatori) attirano i migliori talenti cinesi.
Immagine: Ensigame.com
L'affermazione dei costi di formazione da 6 milioni di dollari è fuorviante, rappresentando solo l'utilizzo della GPU pre-allenamento, esclusa la ricerca, la raffinatezza, l'elaborazione dei dati e le infrastrutture. L'investimento totale di intelligenza artificiale di Deepseek supera $ 500 milioni. La sua struttura magra facilita l'innovazione efficiente.
Immagine: Ensigame.com
Il successo di Deepseek mostra il potenziale di una società di intelligenza artificiale indipendente ben finanziata. Tuttavia, la sua narrazione "economica" è esagerata; Miliardi di investimenti, progressi tecnologici e un team forte sono fattori cruciali. Nonostante ciò, i costi di DeepSeek sono ancora significativamente sottostimati (ad esempio, $ 5 milioni per R1 contro $ 100 milioni per Chatgpt4o).