最新報導指出,近來爆紅的 DeepSeek 正積極籌備適配國產 GPU,以優化自家大模型技術的硬體相容性,且該 AI 新創公司可能早在研發大模型時繞過美國 AI 晶片巨擘輝達 (NVDA.US) 的「統一運算架構」(CUDA)框架,為未來適配中國國產 GPU 做好準備。
中國《快科技》、《芯榜》與《騰訊網》報導,DeepSeek 之所以積極為適配國產 GPU 做準備,是希望在面臨外部算力限制時,透過國產硬體實現更高效、更靈活的模型訓練與部署。
另據美國科技網站《Tom's Hardware》報導,DeepSeek 在使用輝達 H800 晶片進行訓練時,使用了輝達底層硬體指令 PTX 語言,而非 CUDA。
北京航空航太大學副教授黃雷說,繞過 CUDA 代表 DeepSeek 可直接根據 GPU 的驅動函數做一些新的開發,從而實現更加細微性的操作。
《快科技》與《騰訊網》引述知情人士報導指出,DeepSeek 擁有一些擅長寫 PTX 語言的內部開發者,之後使用中國國產 GPU,在硬體適配方面將會更得心應手。只要了解這些硬體驅動提供的一些基本函數介面,就可仿照輝達 GPU 硬體的程式設計介面去寫相關的代碼,進而讓自家大模型更加容易適配國產硬體。
輝達開發的軟硬體整合技術 CUDA 是一種通用程式框架,允許開發者利用輝達的圖形處理器 (GPU) 進行運算。
由於 CUDA 大幅降低研發大模型的難度,因此全球大模型開發商都傾向於選擇使用輝達的 CUDA 技術,輝達因此占據全球人工智慧領域的壟斷地位。
(美股為即時串流報價; OTC市場股票除外,資料延遲最少15分鐘。)新聞來源 (不包括新聞圖片): 鉅亨網