Zaskakująco niedrogi model AI Deepseek wyzwala gigantów branżowych. Pomimo roszczeń o zaledwie 6 milionów dolarów kosztów szkolenia Deepseek V3, bliższe spojrzenie ujawnia znacznie bardziej znaczącą inwestycję.
Samo introduk Deepseek: „Cześć, zostałem stworzony, abyś mógł zapytać o wszystko i uzyskać odpowiedź, która może cię nawet zaskoczyć”, podkreśla jego ambicje. Ta sztuczna inteligencja znacząco wpłynęła na rynek, w szczególności powodując poważny spadek akcji NVIDIA.
Obraz: engame.com
Innowacyjna architektura Deepseek V3 jest kluczem do jej wydajności:
- Prognozowanie wielu tokenów (MTP): Prognozuje wiele słów jednocześnie, zwiększając dokładność i szybkość.
- Mieszanka ekspertów (MOE): Zastosuje 256 sieci neuronowych, aktywując osiem dla każdego tokena, przyspieszając szkolenie i poprawiając wydajność.
- Uczciwa uwaga z wieloma głównymi (MLA): Wielokrotnie wyodrębnia kluczowe szczegóły, minimalizując utratę informacji i zwiększając zrozumienie niuansów.
Obraz: engame.com
Jednak semianaliza ujawniła obszerną infrastrukturę Deepseek: około 50 000 GPU Nvidia Hopper (w tym jednostki H800, H100 i H20) rozłożonych na wiele centrów danych. Całkowita inwestycja serwera szacuje się na 1,6 miliarda USD, a koszty operacyjne wynoszą 944 mln USD.
Deepseek, spółka zależna od wysokiej flyer, jest właścicielem centrów danych, oferując kontrolę i szybsze wdrażanie innowacji. Jego status samofinansowany zwiększa zwinność. Wysokie wynagrodzenie (ponad 1,3 miliona dolarów rocznie dla niektórych badaczy) przyciągają najlepsze chińskie talenty.
Obraz: engame.com
Roszczenie kosztów szkoleń w wysokości 6 milionów dolarów wprowadza w błąd, co stanowi jedynie korzystanie z GPU przed treningiem, wykluczając badania, udoskonalanie, przetwarzanie danych i infrastrukturę. Całkowita inwestycja AI Deepseek przekracza 500 milionów dolarów. Jego szczupła struktura ułatwia wydajne innowacje.
Obraz: engame.com
Sukces Deepseek pokazuje potencjał dobrze finansowanej niezależnej firmy AI. Jednak jej „przyjazna budżet” narracja jest przesadzona; Kluczowe czynniki są miliardy w zakresie inwestycji, postępów technologicznych i silnym zespołem. Mimo to koszty Deepeek nadal znacznie podcinają konkurencję (np. 5 milionów dolarów za R1 w porównaniu z 100 milionami dolarów na Chatgpt4O).