El modelo de IA sorprendentemente económico de Deepseek desafía a los gigantes de la industria. A pesar de las afirmaciones de solo un costo de capacitación de $ 6 millones para Deepseek V3, una mirada más cercana revela una inversión mucho más sustancial.
La autointroducción de Deepseek: "Hola, fui creado para que puedas preguntar cualquier cosa y obtener una respuesta que incluso te sorprenda", resalta su ambición. Esta IA ha impactado significativamente el mercado, especialmente causando una gran caída de acciones de NVIDIA.
Imagen: Ensigame.com
La arquitectura innovadora de Deepseek V3 es clave para su rendimiento:
- Predicción múltiple (MTP): predice múltiples palabras simultáneamente, aumentando la precisión y la velocidad.
- Mezcla de expertos (MOE): Emplea 256 redes neuronales, activando ocho para cada token, acelerando la capacitación y mejorando el rendimiento.
- Atención latente de múltiples cabezas (MLA): extrae repetidamente detalles clave, minimizando la pérdida de información y mejorando la comprensión de los matices.
Imagen: Ensigame.com
Sin embargo, el semianálisis reveló la amplia infraestructura de Deepseek: aproximadamente 50,000 GPU de tolva NVIDIA (incluidas las unidades H800, H100 y H20) se extienden en múltiples centros de datos. La inversión total del servidor se estima en $ 1.6 mil millones, con costos operativos que alcanzan los $ 944 millones.
Deepseek, una subsidiaria de High-Flyer, posee sus centros de datos, ofrece control e implementación de innovación más rápida. Su estado autofinanciado mejora la agilidad. Los salarios altos (más de $ 1.3 millones anuales para algunos investigadores) atraen el mejor talento chino.
Imagen: Ensigame.com
El reclamo de costos de capacitación de $ 6 millones es engañoso, lo que representa solo el uso de la GPU previa al entrenamiento, excluyendo la investigación, el refinamiento, el procesamiento de datos e infraestructura. La inversión total de IA de Deepseek supera los $ 500 millones. Su estructura magra facilita la innovación eficiente.
Imagen: Ensigame.com
El éxito de Deepseek muestra el potencial de una compañía de IA independiente bien financiada. Sin embargo, su narrativa "económica" es exagerada; miles de millones en inversiones, avances tecnológicos y un equipo fuerte son factores cruciales. A pesar de esto, los costos de Deepseek aún socavaron significativamente a los competidores (por ejemplo, $ 5 millones para R1 versus $ 100 millones para ChatGPT4O).