女性爱爱视频_www激情_日韩美女久久_欧美日本在线播放_都市激情 亚洲色图_日日夜夜狠狠_欧美视频免费在线_一本色道久久亚洲精品加勒比_国精品无码一区二区三区在线蜜臀_69xx在线观看视频_四虎影院精品在线观看_天天干天天拍_日韩成人午夜_www.伊人_亚洲成国产人片在线观看_精品一区二区网站_欧美精品一区二区性色_www射com_久久露脸视频_丰满大乳一级淫片免费播放

登錄
首頁 > 汽車測評 > 華為發(fā)布AI推理新技術(shù) 將于今年9月正式開源

華為發(fā)布AI推理新技術(shù) 將于今年9月正式開源

發(fā)布時(shí)間:2025-08-13 17:14:21

8月12日訊(記者 黃心怡)華為今日發(fā)布AI推理創(chuàng)新技術(shù)UCM(推理記憶數(shù)據(jù)管理器)。作為一款以KV Cache為中心的推理加速套件,其融合了多類型緩存加速算法工具,分級管理推理過程中產(chǎn)生的KV Cache記憶數(shù)據(jù),擴(kuò)大推理上下文窗口,以實(shí)現(xiàn)高吞吐、低時(shí)延的推理體驗(yàn),降低每Token推理成本。

據(jù)悉,華為計(jì)劃于2025年9月正式開源UCM,屆時(shí)將在魔擎社區(qū)首發(fā),后續(xù)逐步貢獻(xiàn)給業(yè)界主流推理引擎社區(qū),并共享給業(yè)內(nèi)所有Share Everything(共享架構(gòu))存儲廠商和生態(tài)伙伴。

IDC預(yù)測,到2027年中國智能算力中,推理算力占比將從2023年的41%左右上升到72.6%左右。中國信息通信研究院人工智能研究所平臺與工程化部主任曹峰表示,大模型推理需求爆發(fā)。一方面大模型服務(wù)調(diào)用量、推理計(jì)算量將翻倍,另一方面大模型推理算力供給將超過訓(xùn)練,基礎(chǔ)設(shè)施重心將逐步向推理偏移。

不過,當(dāng)前AI推理應(yīng)用落地過程中存在推不動、推得慢、推得貴等問題。華為數(shù)據(jù)存儲產(chǎn)品線總裁周躍峰舉例:中國互聯(lián)網(wǎng)大模型的首Token時(shí)延普遍慢于海外互聯(lián)網(wǎng)頭部的首Token時(shí)延,海外頭部大模型的推理吞吐率也要遠(yuǎn)高于中國。因此,如何改進(jìn)推理系統(tǒng)的效率和體驗(yàn)是重要課題。這也是華為此次推出UCM推理記憶數(shù)據(jù)管理器的原因。

據(jù)介紹,UCM推理記憶數(shù)據(jù)管理器已經(jīng)在中國銀聯(lián)的客戶服務(wù)、營銷策劃、辦公會議等業(yè)務(wù)場景中,開展AI推理加速應(yīng)用試點(diǎn)。

華為數(shù)據(jù)存儲產(chǎn)品線副總裁、閃存領(lǐng)域總裁謝黎明表示,從銀行業(yè)來看,不管是生產(chǎn)環(huán)境的投研分析,還是輿情分析也好,都會涉及到非常多的長序列輸入。“比如一份投研報(bào)告就是上兆級別,精準(zhǔn)營銷所需要輸入的上下文也是長序列,所以推不動這個(gè)問題經(jīng)常出現(xiàn)。其次是推得慢的問題,核心就是并發(fā)上不去,上去之后每Token時(shí)延特別長。另外推得貴,原因是需要耗費(fèi)大量的算力。”

華為數(shù)據(jù)存儲產(chǎn)品線AI存儲首席架構(gòu)師李國杰進(jìn)一步解釋,不管是行業(yè)調(diào)研報(bào)告、公司財(cái)務(wù)信息以及其他公開信息,都是超長上下文的多源信息匯聚。隨著邁向Agentic AI(代理式AI),這些信息會拆成很多步,逐步地深度挖掘,最終給出一個(gè)專業(yè)的趨勢判斷和報(bào)告。這對顯存、計(jì)算量都會有很大的壓力。

推理體驗(yàn)和推理成本,將成為未來AI行業(yè)化落地的一大阻礙。“到了Agentic AI時(shí)代,Token消費(fèi)相比以前是百萬級的,成本過高意味著落地就沒有了一個(gè)基本的前提,沒有人用得起。”謝黎明稱。

談及AI的發(fā)展趨勢,李國杰認(rèn)為,模型智能轉(zhuǎn)向數(shù)據(jù)智能,這在專業(yè)領(lǐng)域已基本成為共識。未來,華為會基于UCM構(gòu)筑更多的Agentic AI能力,以及多模檢索和數(shù)據(jù)湖的能力等等。

“從GPT5的發(fā)布可以看到,傳統(tǒng)的Scaling Law模式已經(jīng)遇到瓶頸。從應(yīng)用需求的角度來講,客戶開始關(guān)注AI的商業(yè)循環(huán)和商業(yè)變現(xiàn),更關(guān)注體驗(yàn)。從技術(shù)驅(qū)動的角度,當(dāng)模型的智能水平遇到瓶頸,會系統(tǒng)化地轉(zhuǎn)向數(shù)據(jù)智能。因?yàn)槠浔举|(zhì)原因是缺少高質(zhì)量數(shù)據(jù),大量用AI合成數(shù)據(jù)、數(shù)據(jù)荒以及數(shù)據(jù)質(zhì)量的問題,都會成為新的產(chǎn)業(yè)研究焦點(diǎn)。”

華為計(jì)劃于今年9月份開源UCM,目前已有訊飛等生態(tài)伙伴加入。李國杰透露,“很多政府行業(yè)、金融行業(yè)、制造行業(yè)等客戶,已經(jīng)使用起來。我們會與更多的基礎(chǔ)設(shè)施和生態(tài)伙伴一起共建,也會與更多具有非常典型性或者行業(yè)性的客戶,一起共建。”

Copyright 2017-2025 新車測評網(wǎng) 版權(quán)所有  ICP備18049689號-30