在華為全聯(lián)接大會2025上 ,華為輪值董事長徐直軍分享了昇騰芯片的規(guī)劃路線,并推出全球最強(qiáng)超節(jié)點(diǎn)和集群 。
他透露,未來三年 ,直至2028年,華為開發(fā)和規(guī)劃了三個系列,分別是Ascend(昇騰)950系列 ,包括兩顆芯片:Ascend950PR和Ascend 950DT,以及Ascend 960 、Ascend 970系列,更多具體芯片還在規(guī)劃中。
結(jié)合已經(jīng)推出或正在研發(fā)中的昇騰芯片 ,華為將帶來更多超節(jié)點(diǎn)和集群產(chǎn)品。包括Atlas 950超節(jié)點(diǎn)和Atlas 960超節(jié)點(diǎn),分別支持8192張和15488張的昇騰卡 。并將在2027年第四季度,基于Atlas 960超節(jié)點(diǎn)同步推出Atlas 960 SuperCluster,集群規(guī)模提升到百萬卡級。
以下為徐直軍針對昇騰芯片、超節(jié)點(diǎn)和集群的演講內(nèi)容 ,經(jīng)過《科創(chuàng)板日報(bào)》刪減和整理:
算力的基礎(chǔ)是芯片,昇騰芯片是華為AI算力戰(zhàn)略的基礎(chǔ)。未來3年,至2028年 ,我們在開發(fā)和規(guī)劃了三個系列,分別是Ascend 950系列,包括兩顆芯片:Ascend 950PR和Ascend 950DT ,以及Ascend 960、Ascend 970系列,更多具體芯片還在規(guī)劃中 。
目前正在開發(fā) 、且即將推出的芯片叫Ascend 950系列,包括Ascend 950 PR和Ascend 950 DT。
與前一代昇騰芯片相比 ,Ascend 950 在以下幾個方面實(shí)現(xiàn)了根本性提升。
第一,新增支持業(yè)界標(biāo)準(zhǔn)FP8/MXFP8/MXFP4等低數(shù)值精度數(shù)據(jù)格式,算力分別達(dá)到1P和2P ,提升訓(xùn)練效率和推理吞吐 。并特別支持華為自研的HiF8,在保持FP8的高效的同時,精度非常接近FP16。
第二,大幅度提升了向量算力。這主要通過三個方面實(shí)現(xiàn):其一 ,提升向量算力占比;其二,采用創(chuàng)新的新同構(gòu)設(shè)計(jì),即支持 SIMD/SIMT 雙編程模型 ,SIMD能夠像流水線一樣處理“大塊”向量,而SIMT便于靈活處理“碎片化 ”數(shù)據(jù);其三,把內(nèi)存訪問顆粒度從512字節(jié)減少到128字節(jié) ,內(nèi)存訪問更精細(xì),從而更好地支持了離散且不連續(xù)的內(nèi)存訪問。
第三,互聯(lián)帶寬相比Ascend 910C提升了2.5倍 ,達(dá)到2TB/s 。
第四,結(jié)合推理不同階段對于算力、內(nèi)存、訪存帶寬及推薦 、訓(xùn)練的需求不同,我們自研了兩種HBM ,分別是:HiBL 1.0和HiZQ 2.0。不同的自研HBM與Ascend 950 Die合封,分別構(gòu)成芯片Ascend 950PR:面向Prefill和推薦場景,以及Ascend 950DT:面向Decode和訓(xùn)練場景。
其中,Ascend 950PR主要面向推理Prefill階段和推薦業(yè)務(wù)場景 ,將在2026年一季度推出,首先支持的產(chǎn)品形態(tài)是標(biāo)卡和超節(jié)點(diǎn)服務(wù)器 。
而Ascend 950DT,更注重推理Decode階段和訓(xùn)練場景。由于推理Decode階段和訓(xùn)練對互聯(lián)帶寬和訪存帶寬要求高 ,華為開發(fā)了HiZQ 2.0,使內(nèi)存容量達(dá)到144GB,內(nèi)存訪問帶寬達(dá)到4TB/s。同時把互聯(lián)帶寬提升到了2TB/s 。其次 ,支持了FP8/MXFP8/MXFP4/HiF8數(shù)據(jù)格式。Ascend 950DT 將在2026年Q4推出。
第三顆是在規(guī)劃中的芯片Ascend 960,在算力、內(nèi)存訪問帶寬、內(nèi)存容量 、互聯(lián)端口數(shù)等各種規(guī)格上相比Ascend 950翻倍,大幅度提升訓(xùn)練、推理等場景的性能;同時還支持華為自研的HiF4數(shù)據(jù)格式 。它是目前業(yè)界最優(yōu)的4bit精度實(shí)現(xiàn) ,能進(jìn)一步提升推理吞吐,并且比業(yè)界FP4方案的推理精度更優(yōu)。Ascend 960將在2027年四季度推出。
最后一顆是在規(guī)劃中的Ascend 970,這顆芯片的一些規(guī)格還在討論中 。總體方向是 ,在各項(xiàng)指標(biāo)上大幅度升級,全面升級訓(xùn)練和推理性能。目前的初步考慮是,相比Ascend 960,Ascend 970的FP4算力、FP8算力、互聯(lián)帶寬要全面翻倍 ,內(nèi)存訪問帶寬至少增加1.5倍。Ascend 970計(jì)劃在2028年四季度推出。
總體上,我們將以幾乎一年一代算力翻倍的速度,同時圍繞更易用 ,更多數(shù)據(jù)格式 、更高帶寬等方向持續(xù)演進(jìn),持續(xù)滿足AI算力不斷增長的需求 。
可以看到,相比Ascend 910B/910C ,從Ascend 950開始的主要變化包括:
引入SIMD/SIMT新同構(gòu),提升編程易用性;
支持更加豐富的數(shù)據(jù)格式,包括FP32 /HF32 /FP16/BF16/FP8/MXFP8/HiF8/MXFP4/HiF4等;
支持更大的互聯(lián)帶寬 ,其中950系列為2TB/s,970系列提升到4TB/s;
支持更大的算力,F(xiàn)P8算力從950系列的1 PFLOPS提升到960的2 PFLOPS、970的4 PFLOPS;FP4算力從950的2 PFLOPS提升到960的4 PFLOPS、970的8 PFLOPS;
內(nèi)存容量逐漸加倍 ,而內(nèi)存訪問帶寬將翻兩番。
從大型AI算力基礎(chǔ)設(shè)施建設(shè)的技術(shù)方向看,超節(jié)點(diǎn)已經(jīng)成為主導(dǎo)性產(chǎn)品形態(tài),并正在成為AI基礎(chǔ)設(shè)施建設(shè)的新常態(tài)。超節(jié)點(diǎn)事實(shí)上就是一臺能學(xué)習(xí) 、思考、推理的計(jì)算機(jī),物理上由多臺機(jī)器組成 ,但邏輯上以一臺機(jī)器學(xué)習(xí)、思考 、推理 。
今年3月份,華為正式推出了Atlas 900超節(jié)點(diǎn),滿配支持384卡 ,最大算力可達(dá)300 PFLOPS。CloudMatrix384超節(jié)點(diǎn),則是華為云基于Atlas 900超節(jié)點(diǎn)構(gòu)建的云服務(wù)實(shí)例。Atlas 900超節(jié)點(diǎn)自上市以來,已經(jīng)累計(jì)部署超過300套 ,服務(wù)20多個客戶,涵蓋互聯(lián)網(wǎng)、電信、制造等多個行業(yè) 。
結(jié)合已經(jīng)推出或正在研發(fā)中的昇騰芯片,將帶來更多超節(jié)點(diǎn)和集群產(chǎn)品。今天發(fā)布的第一款產(chǎn)品——Atlas 950超節(jié)點(diǎn) ,是基于Ascend 950DT打造。
Atlas 950超節(jié)點(diǎn)支持8192張基于Ascend 950DT的昇騰卡,是Atlas 900超節(jié)點(diǎn)的20多倍,我們習(xí)慣稱呼的昇騰卡 ,每張卡對應(yīng)一顆Ascend 950DT芯片,8192張昇騰卡等同于8192顆Ascend 950DT芯片 。
Atlas 950超節(jié)點(diǎn)滿配包括由128個計(jì)算柜 、32個互聯(lián)柜,共計(jì)160個機(jī)柜組成,占地面積1000平方米左右 ,柜間采用全光互聯(lián)??偹懔Υ蠓忍嵘?,其中,F(xiàn)P8算力達(dá)到8E FLOPS ,F(xiàn)P4算力達(dá)到16E FLOPS?;ヂ?lián)帶寬達(dá)到16PB/s,這個數(shù)字意味著,Atlas 950一個產(chǎn)品的總互聯(lián)帶寬 ,已經(jīng)超過今天全球互聯(lián)網(wǎng)峰值帶寬的10倍有余 。
Atlas 950超節(jié)點(diǎn)的上市時間是:2026年四季度。
我們很自豪的看到,Atlas 950超節(jié)點(diǎn),至少在未來多年都將保持是全球最強(qiáng)算力的超節(jié)點(diǎn) ,并且在各項(xiàng)主要能力上都遠(yuǎn)超業(yè)界主要產(chǎn)品。其中,相比英偉達(dá)同樣將在明年下半年上市的NVL144,Atlas 950超節(jié)點(diǎn)卡的規(guī)模是其56.8倍 ,總算力是其6.7倍,內(nèi)存容量是其15倍,達(dá)到1152TB;互聯(lián)帶寬是其62倍,達(dá)到16.3PB/s。即使是與英偉達(dá)計(jì)劃2027年上市的 NVL576相比 ,Atlas 950超節(jié)點(diǎn)在各方面依然是領(lǐng)先的 。
算力、內(nèi)存容量、內(nèi)存訪問速度 、互聯(lián)帶寬等能力的大幅度增強(qiáng),為大模型訓(xùn)練性能和推理吞吐帶來顯著提升。相比華為已經(jīng)推出的Atlas 900超節(jié)點(diǎn),Atlas 950超節(jié)點(diǎn)的訓(xùn)練性能提升17倍 ,達(dá)到4.91M TPS。通過支持FP4數(shù)據(jù)格式,Atlas 950超節(jié)點(diǎn)的推理性能提升達(dá)26.5倍,達(dá)到19.6M TPS 。
8192卡超節(jié)點(diǎn)并不是終點(diǎn)。今天發(fā)布的第二款超節(jié)點(diǎn)產(chǎn)品Atlas 960超節(jié)點(diǎn) ,其基于Ascend 960,最大可支持15488卡。Atlas 960超節(jié)點(diǎn)由176個計(jì)算柜,44個互聯(lián)柜 ,共220個機(jī)柜,占地面積約2200平方米 。
Atlas 960超節(jié)點(diǎn)的上市時間是:2027年四季度。
基于Ascend 960,Atlas 960超節(jié)點(diǎn)總算力、內(nèi)存容量、互聯(lián)帶寬在Atlas 950基礎(chǔ)上再翻倍。其中 ,F(xiàn)P8總算力將達(dá)到30E FLOPS,而FP4總算力將達(dá)到60 EFLOPS;內(nèi)存容量達(dá)到4460TB,互聯(lián)帶寬達(dá)到34PB/s 。大模型訓(xùn)練和推理的性能相比Atlas 950超節(jié)點(diǎn),將分別提升3倍和4倍以上 ,達(dá)到15.9M TPS 和80.5M TPS。
在通用計(jì)算領(lǐng)域,我們同樣認(rèn)為,超節(jié)點(diǎn)技術(shù)能夠帶來很大的價(jià)值。TaiShan 950超節(jié)點(diǎn) ,基于Kunpeng 950打造,全球首個通用計(jì)算超節(jié)點(diǎn),其最大支持16節(jié)點(diǎn) ,32個處理器,最大內(nèi)存48TB,同時支持內(nèi)存、SSD 、DPU池化 。
超節(jié)點(diǎn)的價(jià)值 ,不僅僅體現(xiàn)在智算和通算傳統(tǒng)業(yè)務(wù)領(lǐng)域?;ヂ?lián)網(wǎng)產(chǎn)業(yè)廣泛應(yīng)用的推薦系統(tǒng),正在從傳統(tǒng)推薦算法向生成式推薦系統(tǒng)演進(jìn)。我們可以基于TaiShan 950和Atlas 950打造成混合超節(jié)點(diǎn),為下一代生成式推薦系統(tǒng)打開全新架構(gòu)方向。
一方面 ,通過超大帶寬、超低時延互聯(lián)以及超大內(nèi)存,混合超節(jié)點(diǎn)構(gòu)成超大共享內(nèi)存池,支持PB級推薦系統(tǒng)嵌入表,從而支撐超高維度用戶特征;另一方面 ,混合超節(jié)點(diǎn)的超大AI算力,能夠支持超低時延推理和特征檢索 。因此,混合超節(jié)點(diǎn)是面向下一代生成式推薦系統(tǒng)的解決方案的全新選擇。
為了達(dá)成Atlas 950/960超節(jié)點(diǎn)對互聯(lián)的技術(shù)要求 ,為了實(shí)現(xiàn)萬卡超節(jié)點(diǎn)還能是一臺計(jì)算機(jī),華為開創(chuàng)了超節(jié)點(diǎn)架構(gòu)并開創(chuàng)了新型的互聯(lián)協(xié)議,能夠支撐萬卡級超節(jié)點(diǎn)架構(gòu)?;谶@個互聯(lián)協(xié)議的超節(jié)點(diǎn)架構(gòu)的核心價(jià)值主張是:萬卡超節(jié)點(diǎn) ,一臺計(jì)算機(jī),也就是說,通過該互聯(lián)協(xié)議 ,把數(shù)萬規(guī)模的計(jì)算卡,聯(lián)接成一個超節(jié)點(diǎn),能夠像一臺計(jì)算機(jī)一樣工作、學(xué)習(xí) 、思考、推理 。
萬卡級超節(jié)點(diǎn)架構(gòu)應(yīng)該具備6大特征 ,分別是總線級互聯(lián)、平等協(xié)同 、全量池化、協(xié)議歸一、大規(guī)模組網(wǎng) 、高可用性。我們?yōu)檫@個面向超節(jié)點(diǎn)的新型互聯(lián)協(xié)議取名“靈衢”,英文名稱:UB,UnifiedBus。今天,我們正式發(fā)布靈衢UnifiedBus ,一個面向超節(jié)點(diǎn)的互聯(lián)協(xié)議 。
同時,華為將開放靈衢2.0技術(shù)規(guī)范,歡迎產(chǎn)業(yè)界伙伴基于靈衢研發(fā)相關(guān)產(chǎn)品和部件 ,共建靈衢開放生態(tài)。
接下來帶來兩個集群產(chǎn)品:首先是Atlas 950 SuperCluster 50萬卡集群。
Atlas 950 SuperCluster集群由64個Atlas 950超節(jié)點(diǎn)互聯(lián)組成,把1萬多機(jī)柜中的52萬多片昇騰950DT組成為一個整體,F(xiàn)P8總算力可達(dá)524 EFLOPS 。上市時間與Atlas 950超節(jié)點(diǎn)同步 ,即2026年Q4。
在集群組網(wǎng)上,我們同時支持UBoE與RoCE兩種協(xié)議,UBoE是把UB協(xié)議承載在以太網(wǎng)上 ,讓客戶能夠利用現(xiàn)有以太交換機(jī)。相比傳統(tǒng)RoCE,UBoE組網(wǎng)的靜態(tài)時延更低、可靠性更高,交換機(jī)和光模塊數(shù)量都更節(jié)省 ,所以,我們推薦UBoE 。
Atlas 950 SuperCluster集群,相比當(dāng)前世界上最大的集群 xAI Colossus,規(guī)模是其2.5倍 ,算力是其1.3倍,是當(dāng)之無愧的全世界最強(qiáng)算力集群!無論是當(dāng)下主流的千億稠密、稀疏大模型訓(xùn)練任務(wù),還是未來的萬億 、十萬億大模型訓(xùn)練 ,超節(jié)點(diǎn)集群都可以成為性能強(qiáng)悍的算力底座,高效穩(wěn)定地支持人工智能持續(xù)創(chuàng)新。
在2027年Q4,我們還將基于Atlas 960超節(jié)點(diǎn) ,同步推出Atlas 960 SuperCluster,集群規(guī)模進(jìn)一步提升到百萬卡級,F(xiàn)P8總算力達(dá)到2 ZFLOPS ,F(xiàn)P4總算力達(dá)到4 ZFLOPS。并且,它同樣也支持UBoE與RoCE兩種協(xié)議,在UBoE協(xié)議加持下 ,性能與可靠性同樣更優(yōu),并且,靜態(tài)時延和網(wǎng)絡(luò)無故障時間優(yōu)勢進(jìn)一步擴(kuò)大,因此繼續(xù)推薦UBoE組網(wǎng)。通過Atlas 960 SuperCluster ,我們將持續(xù)加速客戶應(yīng)用創(chuàng)新,探索智能水平新高 。
股票開戶費(fèi)是多少:買股票怎么用杠桿來炒股-雷軍已發(fā)起訴訟!央視起底“黑公關(guān)”:某些虛假測評能賺數(shù)百萬元
杠桿怎么求:炒股股票怎么開戶流程-低空經(jīng)濟(jì)大突破!時的科技斬獲中東客戶10億美元訂單 A股這些供應(yīng)鏈廠商將受益
配資操盤炒股配資開戶:股票杠桿盈利怎么算-突然大幅拉升!特朗普重磅宣布!
個人怎么加杠桿炒股:股票開戶哪個手續(xù)費(fèi)低-煤價(jià)起飛!冷冬預(yù)期引爆行情 新一輪上行周期開啟?
加杠桿炒股指怎么弄:炒股股票開戶流程-流感疫苗出現(xiàn)5.5元“冰點(diǎn)價(jià)” 今年以來價(jià)格多次探底
散戶股票怎么買:杠桿炒股開戶-超51家!A股公司赴港IPO火了 上市方式又現(xiàn)創(chuàng)新!
炒股開戶后怎么買股票:如何融資加杠桿炒股-融資余額突破2.4萬億元 科技龍頭被猛加倉!低PE+機(jī)構(gòu)扎堆關(guān)注股揭曉
炒股怎么杠桿:股票開戶那家證券好-確診超4000例!關(guān)于基孔肯雅熱 張文宏首次發(fā)聲!世衛(wèi)警告:正在全球多地?cái)U(kuò)散
熱豐網(wǎng)-安全的股票配資平臺,有保障的股票配資公司提示:文章來自網(wǎng)絡(luò),不代表本站觀點(diǎn)。
記者|趙陽戈年初,證監(jiān)會就修改《證券發(fā)行與承銷管理辦法》部分條款向社會公開征求意見,市場也將注意力投向了...
【隔夜行情】?周五(2025年3月21日),A股三大指數(shù)集體下跌,截至收盤,截止收盤,滬指跌1.29%,報(bào)收33...
記者王珍中國國際經(jīng)濟(jì)交流中心副理事長、國務(wù)院發(fā)展研究中心原副主任王一鳴周一在“中國發(fā)展高層論壇2025...
3月24日,易方達(dá)國證自由現(xiàn)金流ETF公開發(fā)售。該產(chǎn)品跟蹤國證自由現(xiàn)金流指數(shù),這個指數(shù)是什么?有哪些優(yōu)勢?投資價(jià)值如何?...
記者辛圓3月25日,博鰲亞洲論壇旗艦報(bào)告《亞洲經(jīng)濟(jì)前景及一體化進(jìn)程2025年度報(bào)告》(以下簡稱《報(bào)告》...
2025年3月25日,倍輕松(688793.SH)公告稱,公司股東寧波倍松投資有限公司(簡稱“寧波倍松”)擬通過大宗交易...
2025年3月24日下午三點(diǎn)A股收盤后,港股科技板塊持續(xù)走強(qiáng)至四點(diǎn)十分收盤。消息面上,一方面美元相對于人民幣連續(xù)3個交易...
國海富蘭克林基金國富深化價(jià)值基金經(jīng)理劉曉日前發(fā)表了對?2025?年市場的展望。劉曉指出,國內(nèi)經(jīng)濟(jì)正處于復(fù)蘇通道,市場大幅...
文/吳治邦3月24日早盤,在2024年年底壓哨實(shí)施完畢重整計(jì)劃的*ST花王股價(jià)繼續(xù)跌停。自2025年1月...
近日,開源證券大連分公司遭大連證監(jiān)局處罰,暫停其辦理需要合格投資者認(rèn)定相關(guān)業(yè)務(wù)六個月。該懲處力度在近年來券商分支機(jī)構(gòu)中并...
記者辛圓給補(bǔ)貼、建平臺,為了吸引更多高層次人才,各地紛紛放出“大招”。據(jù)央廣網(wǎng)周一發(fā)布消息,湖...
3月24日,海洋王照明科技股份有限公司(以下簡稱“海洋王”,002724.SZ)早盤一字跌停,此后股價(jià)拉漲,尾盤封漲停板...
3月24日,AI眼鏡概念股開盤拉升,瀛通通訊直線漲停,明月鏡片漲超10%,比依股份、博士眼鏡、恒玄科技、國光電器等跟漲。...
滬深兩市成交額連續(xù)第44個交易日突破1萬億,較昨日此時縮量超900億。...
當(dāng)?shù)貢r間3月24日,特斯拉美股漲幅擴(kuò)大至5%,現(xiàn)報(bào)262.055美元/股。...