Deepseek yang menghairankan model AI yang murah mencabar gergasi industri. Walaupun tuntutan hanya kos latihan $ 6 juta untuk DeepSeek V3, penampilan yang lebih dekat mendedahkan pelaburan yang jauh lebih besar.
Pengenalan diri Deepseek: "Hai, saya dicipta supaya anda boleh meminta apa-apa dan mendapatkan jawapan yang mungkin mengejutkan anda," menyoroti cita-citanya. AI ini telah memberi kesan yang ketara kepada pasaran, terutamanya menyebabkan kejatuhan saham NVIDIA utama.
imej: ensigame.com
Senibina inovatif DeepSeek V3 adalah kunci kepada prestasinya:
- Ramalan Multi-Token (MTP): Meramalkan beberapa perkataan secara serentak, meningkatkan ketepatan dan kelajuan.
- Campuran Pakar (MOE): Menggaji 256 rangkaian saraf, mengaktifkan lapan untuk setiap token, mempercepatkan latihan dan meningkatkan prestasi.
- Perhatian Laten Multi-Head (MLA): Berulang kali mengekstrak butiran utama, meminimumkan kehilangan maklumat dan meningkatkan pemahaman nuansa.
imej: ensigame.com
Walau bagaimanapun, semianalisis mendedahkan infrastruktur yang luas DeepSeek: kira -kira 50,000 GPU NVIDIA Hopper (termasuk unit H800, H100, dan H20) tersebar di pelbagai pusat data. Jumlah pelaburan pelayan dianggarkan $ 1.6 bilion, dengan kos operasi mencecah $ 944 juta.
DeepSeek, anak syarikat High-Flyer, memiliki pusat datanya, menawarkan kawalan dan pelaksanaan inovasi yang lebih cepat. Status yang dibiayai sendiri meningkatkan ketangkasan. Gaji tinggi (lebih daripada $ 1.3 juta setiap tahun untuk sesetengah penyelidik) menarik bakat Cina teratas.
imej: ensigame.com
Tuntutan kos latihan $ 6 juta adalah mengelirukan, mewakili hanya penggunaan GPU pra-latihan, tidak termasuk penyelidikan, penghalusan, pemprosesan data, dan infrastruktur. Jumlah pelaburan AI DeepSeek melebihi $ 500 juta. Struktur rampingnya memudahkan inovasi yang cekap.
imej: ensigame.com
Kejayaan DeepSeek mempamerkan potensi syarikat AI bebas yang dibiayai dengan baik. Walau bagaimanapun, naratif "mesra bajet" dibesar-besarkan; Berbilion dalam pelaburan, kemajuan teknologi, dan pasukan yang kuat adalah faktor penting. Walaupun demikian, kos DeepSeek masih ketara mengurangkan pesaing (mis., $ 5 juta untuk R1 berbanding $ 100 juta untuk ChatGPT4O).