國產(chǎn)大模型企業(yè)DeepSeek“點燃 ”資本市場 。
近日,DeepSeek宣布其新一代模型DeepSeek-V3.1采用了UE8M0 FP8 Scale參數(shù)精度 ,并明確指出該精度標準是針對即將發(fā)布的下一代國產(chǎn)芯片設(shè)計。這一消息迅速在資本市場引發(fā)強烈反應(yīng),寒武紀等芯片類上市企業(yè)股價集體拉升。
不過,在近兩日舉辦的2025算力大會上,據(jù)《科創(chuàng)板日報》記者的現(xiàn)場采訪和觀察來看 ,大家在聚焦國產(chǎn)算力時,DeepSeek的FP8精度標準雖被討論,但業(yè)內(nèi)人士的情緒顯然沒有資本市場那么高亢。技術(shù)派更關(guān)注FP8在模型訓(xùn)練、推理及生態(tài)標準化上的實際價值與挑戰(zhàn) 。
FP8是什么 ,有哪些提升?
在AI訓(xùn)練與推理過程中,為提升計算效率,數(shù)值精度的降低是一個常見的技術(shù)路徑。
摩爾線程AI Infra總監(jiān)陳志向《科創(chuàng)板日報》記者稱 ,過去,大模型訓(xùn)練推理普遍使用FP32(32位浮點數(shù)),隨后逐步過渡到FP16(16位浮點數(shù))混合精度 ,以減少存儲和通信開銷,F(xiàn)P8則進一步將數(shù)據(jù)寬度壓縮至8位。
“FP8最直接的優(yōu)勢是算力效率翻倍,另一個好處是降低訓(xùn)練和推理過程中網(wǎng)絡(luò)帶寬的通信量 。”陳志稱 ,比如原本傳輸一個FP32數(shù)值需4字節(jié),現(xiàn)在僅需FP8僅需要1字節(jié),雖然網(wǎng)絡(luò)物理帶寬本身未必擴大,但單位時間內(nèi)可傳輸信息是增加的 ,同時也讓存儲要求降低。這意味著在相同功耗下,AI芯片可訓(xùn)練更大的模型或縮短訓(xùn)練時間。
不過,F(xiàn)P8也不是萬能的 。
在2025算力大會現(xiàn)場 ,另一名不愿具名的國產(chǎn)芯片廠商從業(yè)人員告訴《科創(chuàng)板日報》記者,用類似FP8低精度訓(xùn)練推理雖然快,但也容易因數(shù)值范圍太小導(dǎo)致計算出錯。而且 ,不同計算對精度要求不同,像矩陣乘法這類操作對精度不敏感,可以用較低的精度(如FP8)計算;而像累加或某些函數(shù)則需要較高精度。因此 ,業(yè)內(nèi)通常采用“混合精度訓(xùn)練”,根據(jù)計算類型動態(tài)選擇不同的精度,兼顧效率與準確 。
Deepseek能否推動新標準
DeepSeek-V3.1使用UE8M0 FP8 Scale 的參數(shù)精度 ,被視為國產(chǎn)AI芯片即將邁入新階段的信號。受此刺激,寒武紀等芯片類上市公司股價大幅上漲,但產(chǎn)業(yè)界人士態(tài)度更為審慎。
在業(yè)內(nèi)看來,DeepSeek此舉無疑給了國內(nèi)算力廠商的機會 ,F(xiàn)P8代表了算力優(yōu)化的正確方向,大模型訓(xùn)練推理不只是堆砌硬件,但它也并非“靈丹妙藥” ,更需要關(guān)注的是實際落地效果 。此外DeepSeek的這一動作,后續(xù)是否會成為大模型訓(xùn)練與推理的新標準。
在陳志看來,大模型對精度的容忍度越來越高 ,從FP32到FP16,再到FP8,是整個行業(yè)逐步驗證過的路徑。DeepSeek這次驗證了FP8在大規(guī)模模型上的可行性 ,未來在FP8這一標準乃至更高精度上去做研究或者做訓(xùn)練也是一個很重要的方向。
當然,這一趨勢也意味著,國產(chǎn)算力生態(tài)需要同步升級 ,包括芯片 、框架、算力平臺到應(yīng)用層的閉環(huán)適配 。
陳志表示,精度標準一旦變化,上下游廠商也需要聯(lián)動優(yōu)化。摩爾線程已提前布局FP8研究,既是技術(shù)儲備 ,也是為了在生態(tài)調(diào)整中占據(jù)主動。
他進一步說到,大模型訓(xùn)練推理的核心瓶頸不僅是算力規(guī)模,還包括能耗、穩(wěn)定性和集群利用 ,“國內(nèi)萬卡規(guī)模集群已有部署,但還要向大智算集群演進,解決效率與容錯問題 ,確保集群可靠性 。簡單‘堆卡’并不能完全滿足需求,提高單卡效率與集群調(diào)度優(yōu)化同樣關(guān)鍵 ”。
a股怎么開杠桿:股票配資行業(yè)門戶網(wǎng)站-國產(chǎn)AI軟硬協(xié)同加速:DeepSeek新模型上線 一眾芯片廠商官宣Day 0適配
新手買股票的技巧:手機最好用的股票軟件-反傾銷點燃A股模擬芯片賽道 機構(gòu):國產(chǎn)廠商份額有望提升
黑馬股票推薦排名:股票開戶費用后續(xù)費用-國產(chǎn)算力芯片打開千億市場:“FP8精度”意味著什么?產(chǎn)業(yè)鏈底氣何在?
app買股票手續(xù)費:網(wǎng)上交易股票軟件-地王頻現(xiàn)!百強房企拿地金額增長34% 土地市場火爆能否推動樓市復(fù)蘇
股票課程哪個平臺好:漲配資股票配資網(wǎng)址查詢-工信部等三部門印發(fā)輕工業(yè)穩(wěn)增長工作方案 助力行業(yè)持續(xù)回升向好
配資app下載:炒股剛?cè)腴T如何買股票-DeepSeek“帶飛”國產(chǎn)算力板塊 寒武紀市值超5000億元 摩爾線程已支持FP8
熱豐網(wǎng)-安全的股票配資平臺,有保障的股票配資公司提示:文章來自網(wǎng)絡(luò),不代表本站觀點。
記者|趙陽戈年初,證監(jiān)會就修改《證券發(fā)行與承銷管理辦法》部分條款向社會公開征求意見,市場也將注意力投向了...
【隔夜行情】?周五(2025年3月21日),A股三大指數(shù)集體下跌,截至收盤,截止收盤,滬指跌1.29%,報收33...
記者王珍中國國際經(jīng)濟交流中心副理事長、國務(wù)院發(fā)展研究中心原副主任王一鳴周一在“中國發(fā)展高層論壇2025...
3月24日,易方達國證自由現(xiàn)金流ETF公開發(fā)售。該產(chǎn)品跟蹤國證自由現(xiàn)金流指數(shù),這個指數(shù)是什么?有哪些優(yōu)勢?投資價值如何?...
記者辛圓3月25日,博鰲亞洲論壇旗艦報告《亞洲經(jīng)濟前景及一體化進程2025年度報告》(以下簡稱《報告》...
2025年3月25日,倍輕松(688793.SH)公告稱,公司股東寧波倍松投資有限公司(簡稱“寧波倍松”)擬通過大宗交易...
2025年3月24日下午三點A股收盤后,港股科技板塊持續(xù)走強至四點十分收盤。消息面上,一方面美元相對于人民幣連續(xù)3個交易...
國海富蘭克林基金國富深化價值基金經(jīng)理劉曉日前發(fā)表了對?2025?年市場的展望。劉曉指出,國內(nèi)經(jīng)濟正處于復(fù)蘇通道,市場大幅...
文/吳治邦3月24日早盤,在2024年年底壓哨實施完畢重整計劃的*ST花王股價繼續(xù)跌停。自2025年1月...
近日,開源證券大連分公司遭大連證監(jiān)局處罰,暫停其辦理需要合格投資者認定相關(guān)業(yè)務(wù)六個月。該懲處力度在近年來券商分支機構(gòu)中并...
記者辛圓給補貼、建平臺,為了吸引更多高層次人才,各地紛紛放出“大招”。據(jù)央廣網(wǎng)周一發(fā)布消息,湖...
3月24日,海洋王照明科技股份有限公司(以下簡稱“海洋王”,002724.SZ)早盤一字跌停,此后股價拉漲,尾盤封漲停板...
3月24日,AI眼鏡概念股開盤拉升,瀛通通訊直線漲停,明月鏡片漲超10%,比依股份、博士眼鏡、恒玄科技、國光電器等跟漲。...
滬深兩市成交額連續(xù)第44個交易日突破1萬億,較昨日此時縮量超900億。...
當?shù)貢r間3月24日,特斯拉美股漲幅擴大至5%,現(xiàn)報262.055美元/股。...