北電數(shù)智助力DeepSeek與國產(chǎn)芯片適配,加速AI應用落地
DeepSeek的爆火出圈為國產(chǎn)芯片同時帶來了機會與挑戰(zhàn)。一方面,新銳模型和AI原生應用的爆發(fā)會產(chǎn)生更多算力需求,但同時,由于國產(chǎn)芯片在底層架構(gòu)和軟件生態(tài)上的差異,如何高效適配AI模型并充分發(fā)揮算力潛力成為國產(chǎn)芯片領域亟待解決的問題。
近日,北京電子數(shù)智科技有限責任公司(以下簡稱“北電數(shù)智”)依托其“寶塔·模型適配平臺”成功完成DeepSeek V3/R1全尺寸模型與海光DCU、華為、壁仞科技、沐曦等多款國產(chǎn)芯片的混元算力適配,為開發(fā)者和企業(yè)提供了更靈活、高效的算力支持。
技術(shù)創(chuàng)新:DeepSeek模型性能領先
DeepSeek模型作為國產(chǎn)AI技術(shù)的代表,采用了多項創(chuàng)新技術(shù),包括混合專家系統(tǒng)(DeepSeekMoE)、多頭潛在注意力機制(MLA)以及自研訓練框架。這使DeepSeek在大幅減少算力開銷的情況下實現(xiàn)了R1模型與OpenAI o1相當、V3模型與OpenAI 4o相當?shù)男阅鼙憩F(xiàn),展現(xiàn)出高推理效率和低訓練成本的優(yōu)勢。

寶塔·模型適配平臺:抹平芯片差異,異構(gòu)算力高效支撐模型
北電數(shù)智“寶塔·模型適配平臺”抹平了不同芯片架構(gòu)的差異,快速實現(xiàn)對DeepSeek模型的優(yōu)化支持和硬件適配。用戶無需關注底層硬件技術(shù)細節(jié),平臺會根據(jù)模型調(diào)用需求自動匹配合適的算力資源,大幅降低了開發(fā)門檻。目前,該平臺已完成24款基座大模型的適配工作,為開發(fā)者提供了更多算力選擇。
混元推理技術(shù):優(yōu)化效率,降低成本
針對DeepSeek類超大模型的推理任務,數(shù)據(jù)中心的集群化推理技術(shù)顯得尤為重要,例如PD分離(Prefill-Decode分離)技術(shù)就可由不同芯片完成不同階段推理任務實現(xiàn)。北電數(shù)智的混元推理技術(shù)路線與DeepSeek的技術(shù)路線高度契合,能有效解決算力不足問題,為大規(guī)模AI應用創(chuàng)造便利條件。
推動國產(chǎn)算力發(fā)展:從適配到生態(tài)建設
DeepSeek的發(fā)展為行業(yè)帶來了深刻啟示:只有滿足國產(chǎn)原生模型的算力需求,才能真正推動包含國產(chǎn)算力在內(nèi)的中國AI產(chǎn)業(yè)發(fā)展。為全面挖掘國產(chǎn)芯片性能潛力與適配能力,北電數(shù)智還推出了“星火·國產(chǎn)算力AI原生適配認證”,促進國產(chǎn)模型與國產(chǎn)算力的深度融合,推動國產(chǎn)芯片在AI原生應用場景中的迭代與創(chuàng)新。
企業(yè)版內(nèi)測上線:助力AI應用落地
目前,北電數(shù)智已正式開通企業(yè)版內(nèi)測服務,通過“北京數(shù)字經(jīng)濟算力中心”為廣大企業(yè)和開發(fā)者提供便捷、高效的算力支持。無論是模型訓練還是推理任務,用戶都可以在多芯混元算力環(huán)境下輕松構(gòu)建和部署基于DeepSeek模型的AI應用。
北電數(shù)智的一系列舉措,為國產(chǎn)AI芯片與模型的協(xié)同發(fā)展提供了新思路。未來,隨著更多企業(yè)和開發(fā)者加入,國產(chǎn)算力生態(tài)也將迎來更加廣闊的發(fā)展空間。
本文來自投稿,不代表本站立場。作者:小魯,如若轉(zhuǎn)載,請注明出處:《北電數(shù)智助力DeepSeek與國產(chǎn)芯片適配,加速AI應用落地》http://csd7.cn/market/141237.html
評論