DeepSeek令人驚訝的是,廉價的AI模型挑戰了行業巨頭。盡管聲稱DeepSeek V3的培訓成本僅為600萬美元,但仔細觀察仍表明投資要大得多。
DeepSeek的自我引言:“嗨,我是被創造的,所以您可以問任何事情並得到一個甚至可能使您感到驚訝的答案,”它的野心強調。該AI顯著影響了市場,特別是導致NVIDIA的主要股票下跌。
圖像:ensigame.com
DeepSeek V3的創新架構是其性能的關鍵:
- 多語預測(MTP):同時預測多個單詞,提高準確性和速度。
- 專家的混合物(MOE):使用256個神經網絡,每個令牌激活8個,加速培訓並提高性能。
- 多頭潛在注意力(MLA):反複提取關鍵細節,最大程度地減少信息丟失並增強細微差別的理解。
圖像:ensigame.com
但是,半分析揭示了DeepSeek廣泛的基礎設施:大約50,000個NVIDIA HOPPER GPU(包括H800,H100和H20單位)分布在多個數據中心。服務器總投資估計為16億美元,運營成本達到9.44億美元。
高級飛行者的子公司DeepSeek擁有其數據中心,提供控製和更快的創新實施。它的自籌資金地位增強了敏捷性。高薪(一些研究人員每年超過130萬美元)吸引了中國頂級人才。
圖像:ensigame.com
耗資600萬美元的培訓成本索賠具有誤導性,僅代表GPU前的使用,不包括研究,改進,數據處理和基礎架構。 DeepSeek的AI總投資超過了5億美元。它的精益結構有助於有效的創新。
圖像:ensigame.com
DeepSeek的成功展示了一家資金充足的獨立AI公司的潛力。但是,其“預算友好”的敘述被誇大了。數十億美元的投資,技術進步和強大的團隊是關鍵因素。盡管如此,DeepSeek的成本仍然大大降低了競爭對手的速度(例如,R1的500萬美元,而Chatgpt4o的1億美元)。