Deepseek est étonnamment bon marché, le modèle d'IA défie les géants de l'industrie. Malgré les réclamations d'un coût de formation de 6 millions de dollars pour Deepseek V3, un examen plus approfondi révèle un investissement beaucoup plus substantiel.
L'auto-introduction de Deepseek: "Salut, j'ai été créé pour que vous puissiez demander n'importe quoi et obtenir une réponse qui pourrait même vous surprendre", met en évidence son ambition. Cette IA a eu un impact significatif sur le marché, notamment une baisse majeure de stock de NVIDIA.
Image: esigame.com
L'architecture innovante de Deepseek V3 est la clé de ses performances:
- Prédiction multi-token (MTP): prédit plusieurs mots simultanément, augmentant la précision et la vitesse.
- Mélange d'experts (MOE): emploie 256 réseaux de neurones, activant huit pour chaque jeton, accélérant la formation et améliorant les performances.
- Attention latente multi-tête (MLA): Extrait à plusieurs reprises les détails clés, minimisant la perte d'informations et améliorant la compréhension des nuances.
Image: esigame.com
Cependant, la semianalyse a révélé une infrastructure approfondie de Deepseek: environ 50 000 GPU Nvidia Hopper (y compris les unités H800, H100 et H20 H20) se sont propagées sur plusieurs centres de données. L'investissement total du serveur est estimé à 1,6 milliard de dollars, les coûts opérationnels atteignant 944 millions de dollars.
Deepseek, une filiale de High Flyer, possède ses centres de données, offrant un contrôle et une mise en œuvre plus rapide de l'innovation. Son statut autofinancé améliore l'agilité. Les salaires élevés (plus de 1,3 million de dollars par an pour certains chercheurs) attirent les meilleurs talents chinois.
Image: esigame.com
La réclamation de coût de formation de 6 millions de dollars est trompeuse, ne représentant que l'utilisation du GPU avant la formation, à l'exclusion de la recherche, du raffinement, du traitement des données et des infrastructures. L'investissement total total de l'IA de Deepseek dépasse 500 millions de dollars. Sa structure maigre facilite une innovation efficace.
Image: esigame.com
Le succès de Deepseek présente le potentiel d'une entreprise d'IA indépendante bien financée. Cependant, son récit "adapté au budget" est exagéré; Des milliards d'investissements, des progrès technologiques et une équipe solide sont des facteurs cruciaux. Malgré cela, les coûts de Deepseek ont encore considérablement réduit les concurrents (par exemple, 5 millions de dollars pour R1 contre 100 millions de dollars pour ChatGpt4O).