Deepseek รุ่น AI ที่ไม่แพงอย่างน่าประหลาดใจท้าทายยักษ์ใหญ่ในอุตสาหกรรม แม้จะมีการเรียกร้องค่าใช้จ่ายในการฝึกอบรมเพียง 6 ล้านเหรียญสหรัฐสำหรับ Deepseek V3 แต่การมองอย่างใกล้ชิดเผยให้เห็นการลงทุนที่สำคัญยิ่งขึ้น
การแนะนำตัวเองของ Deepseek: "สวัสดีฉันถูกสร้างขึ้นเพื่อให้คุณสามารถถามอะไรก็ได้และรับคำตอบที่อาจทำให้คุณประหลาดใจ" เน้นความทะเยอทะยานของมัน AI นี้ส่งผลกระทบต่อตลาดอย่างมีนัยสำคัญโดยเฉพาะอย่างยิ่งทำให้หุ้น Nvidia ลดลงอย่างมาก
IMGP%Image: Ensigame.com
สถาปัตยกรรมที่เป็นนวัตกรรมของ Deepseek V3 เป็นกุญแจสำคัญในการแสดง:
- การทำนายแบบมัลติเทน (MTP): ทำนายหลายคำพร้อมกันเพิ่มความแม่นยำและความเร็ว
- ส่วนผสมของผู้เชี่ยวชาญ (MOE): มีเครือข่ายประสาท 256 เครือข่ายเปิดใช้งานแปดโทเค็นแต่ละโทเค็นเร่งการฝึกอบรมและปรับปรุงประสิทธิภาพ
- ความสนใจแฝงหลายหัว (MLA): สกัดรายละเอียดที่สำคัญซ้ำ ๆ ซ้ำ ๆ ลดการสูญเสียข้อมูลและเพิ่มความเข้าใจที่แตกต่างกันนิดหน่อย
IMGP%Image: Ensigame.com
อย่างไรก็ตาม Semianalysis เปิดเผยโครงสร้างพื้นฐานที่กว้างขวางของ Deepseek: ประมาณ 50,000 Nvidia Hopper GPU (รวมถึง H800, H100 และ H20 หน่วย) กระจายไปทั่วศูนย์ข้อมูลหลายแห่ง การลงทุนเซิร์ฟเวอร์ทั้งหมดอยู่ที่ประมาณ 1.6 พันล้านดอลลาร์โดยมีค่าใช้จ่ายในการดำเนินงานสูงถึง 944 ล้านดอลลาร์
Deepseek ซึ่งเป็น บริษัท ย่อยของ High-Flyer เป็นเจ้าของศูนย์ข้อมูลเสนอการควบคุมและการใช้นวัตกรรมที่เร็วขึ้น สถานะที่ได้รับการสนับสนุนตนเองช่วยเพิ่มความคล่องตัว เงินเดือนสูง (มากกว่า $ 1.3 ล้านต่อปีสำหรับนักวิจัยบางคน) ดึงดูดความสามารถของจีนชั้นนำ
IMGP%Image: Ensigame.com
การเรียกร้องค่าใช้จ่ายในการฝึกอบรมมูลค่า 6 ล้านดอลลาร์ทำให้เข้าใจผิดซึ่งเป็นเพียงการใช้งานการใช้ GPU ล่วงหน้าเท่านั้นไม่รวมการวิจัยการปรับแต่งการประมวลผลข้อมูลและโครงสร้างพื้นฐาน การลงทุน AI ทั้งหมดของ Deepseek มีมูลค่าสูงกว่า 500 ล้านดอลลาร์ โครงสร้างแบบลีนช่วยอำนวยความสะดวกในนวัตกรรมที่มีประสิทธิภาพ
IMGP%Image: Ensigame.com
ความสำเร็จของ Deepseek นำเสนอศักยภาพของ บริษัท AI อิสระที่ได้รับการสนับสนุนอย่างดี อย่างไรก็ตามการเล่าเรื่อง "เป็นมิตรกับงบประมาณ" นั้นเกินจริง การลงทุนหลายพันล้านความก้าวหน้าทางเทคโนโลยีและทีมที่แข็งแกร่งเป็นปัจจัยสำคัญ อย่างไรก็ตามเรื่องนี้ค่าใช้จ่ายของ Deepseek ยังคงต่ำกว่าคู่แข่งอย่างมีนัยสำคัญ (เช่น $ 5 ล้านสำหรับ R1 เทียบกับ $ 100 ล้านสำหรับ CHATGPT4O)