3月5日,在巴塞羅那舉辦的MWC25期間,華為正式發(fā)布了面向AI大模型場(chǎng)景的新一代AI存儲(chǔ)產(chǎn)品——OceanStor A800。該產(chǎn)品作為業(yè)界首款具備“長(zhǎng)記憶”能力的存儲(chǔ)設(shè)備,采用多級(jí)KV緩存機(jī)制,將中間Token持久化保存,實(shí)現(xiàn)高速數(shù)據(jù)吞吐與毫秒級(jí)推理響應(yīng)。
據(jù)悉,OceanStor A800單框可達(dá)2400萬IOPS與500GB/s帶寬,訓(xùn)練集加載效率是業(yè)界8倍,斷點(diǎn)續(xù)訓(xùn)速度提升4倍;長(zhǎng)記憶功能使大模型推理時(shí)延降低78%,單卡吞吐量提升67%,有效提升AI訓(xùn)練算力利用率,滿足金融、醫(yī)療、投研等多行業(yè)應(yīng)用需求。
華為表示,憑借以存代算及內(nèi)生向量知識(shí)庫等創(chuàng)新技術(shù),OceanStor A800將為AI大模型訓(xùn)練和推理提供堅(jiān)實(shí)數(shù)據(jù)支撐,助力企業(yè)跨越數(shù)據(jù)孤島,構(gòu)建高效智能計(jì)算平臺(tái),推動(dòng)數(shù)智時(shí)代全面升級(jí)。