繼亞馬遜、英偉達、微軟等紛紛上線部署支持用戶訪問DeepSeek-R1模型后,2 月 1 日,華為云與硅基流動聯(lián)合發(fā)布消息,基于華為昇騰云服務的 DeepSeek R1/V3 推理服務正式上線。這一創(chuàng)新服務憑借其卓越性能和多重優(yōu)勢,在 AI 領域掀起波瀾,被 5G 與 6G 公眾號譽為國產(chǎn) AI 基礎設施邁向 “好用” 的關(guān)鍵躍升,具有不可忽視的重大意義與潛在影響。
從技術(shù)層面來看,此次發(fā)布的推理服務實現(xiàn)了重大突破。通過軟硬協(xié)同優(yōu)化,即昇騰芯片與自研加速引擎的有機結(jié)合,該服務在推理性能上達到了與全球高端 GPU 部署模型持平的水平。在當前美國限制英偉達高端 GPU 對華出口的背景下,這無疑為國內(nèi) AI 發(fā)展提供了關(guān)鍵替代方案。據(jù)推測,技術(shù)上可能是通過算子優(yōu)化、模型壓縮、動態(tài)調(diào)度等手段,有效提升了推理效率,降低了對硬件絕對算力的依賴,這表明昇騰生態(tài)在 AI 算力效率、推理能力、運算速度等關(guān)鍵性能指標上已逼近國際領先水平。
在穩(wěn)定性與可靠性方面,華為云昇騰云服務同樣表現(xiàn)出色。此次上線的基于華為云昇騰云服務的 DeepSeekR1/V3 推理服務,能夠確保模型在大規(guī)模生產(chǎn)環(huán)境中穩(wěn)定運行,滿足業(yè)務商?部署需求,提供穩(wěn)定的、生產(chǎn)級服務能力。這充分體現(xiàn)了華為云昇騰云服務不僅注重技術(shù)突破,更在服務的可靠性和穩(wěn)定性上投入大量精力,其在容錯、負載均衡、資源調(diào)度等企業(yè)級場景的成熟度,對于金融、制造、政務等對穩(wěn)定性要求極高的行業(yè)而言,至關(guān)重要。
市場層面,該服務的上線也產(chǎn)生了深遠影響。一方面,填補了國內(nèi)高端 AI 算力缺口。美國對 A100/H100 等 GPU 的限制,導致國內(nèi)算力供需失衡,而華為云昇騰云服務憑借性能對標和彈性算力供給,可有效緩解企業(yè) AI 部署的算力瓶頸,尤其對中小企業(yè)和開發(fā)者而言,是一大利好。另一方面,兩款模型 “零部署” 門檻,開發(fā)者能直接調(diào)用 SiliconCloud API,極大降低了開發(fā)難度和成本,節(jié)省了部署時間和資源,有利于擴大昇騰生態(tài)。同時,該服務能與高端 GPU 部署模型效果持平,且具備穩(wěn)定的生產(chǎn)級服務能力,在市場上極具競爭力,預計將吸引更多對模型性能和穩(wěn)定性有較高要求的企業(yè)和開發(fā)者,廣泛應用于各類商業(yè)場景,助力客戶提升業(yè)務效率、降低成本、優(yōu)化用戶體驗,加速人工智能在商業(yè)領域的落地與應用。
從戰(zhàn)略角度分析,此次合作意義非凡。通過昇騰云服務,華為云從底層芯片到上層應用形成垂直整合能力,突出 “全棧自主可控” 優(yōu)勢。結(jié)合華為在 5G、邊緣計算等領域的積累,未來有望進一步拓展 “云 - 邊 - 端” 協(xié)同的 AI 場景。此外,昇騰芯片及配套服務的成熟,是華為減少對西方技術(shù)依賴的核心舉措,此次合作成功驗證了國產(chǎn)技術(shù)鏈(芯片 + 框架 + 應用)的可行性,增強了市場信心。
對整個行業(yè)而言,該服務的推出推動了 AI 普惠與 AI 產(chǎn)業(yè)升級。政企客戶可借助基于華為云昇騰云服務的 DeepSeekR1/V3 推理服務快速部署 AI 應用,如智能制造、智慧城市等,降低試錯成本,推動傳統(tǒng)產(chǎn)業(yè)智能化轉(zhuǎn)型。中小開發(fā)者也能以低成本接入高性能算力,有望催生更多創(chuàng)新應用,尤其是在邊緣 AI、垂類模型等領域。此外,華為與硅基流動的合作模式,即硬件廠商與算法優(yōu)化服務商的合作,有望成為國產(chǎn) AI 生態(tài)鏈協(xié)作的范本,引導更多企業(yè)加入昇騰生態(tài),形成 “芯片 - 框架 - 模型 - 應用” 的國產(chǎn) AI 閉環(huán)。
華為云與硅基流動此次聯(lián)合發(fā)布基于華為昇騰云服務的 DeepSeek R1/V3 推理服務,不僅是技術(shù)上的重要里程碑,更為行業(yè)提供了性價比高、易于集成且功能強大的 AI 解決方案。隨著這一服務的推廣應用,有望加速更多行業(yè)的數(shù)智化轉(zhuǎn)型步伐,為全球 AI 發(fā)展注入新的活力,我們拭目以待其在未來創(chuàng)造更多輝煌。