12月8日消息,聯(lián)想聯(lián)想于北京成功舉辦“異構(gòu)智算 本地引擎”2025產(chǎn)業(yè)聯(lián)盟高峰論壇暨AI算力基礎(chǔ)設(shè)施新品發(fā)布會。發(fā)布
會上正式推出“聯(lián)想AI工廠”解決方案,異構(gòu)助力企業(yè)數(shù)據(jù)中心實現(xiàn)從傳統(tǒng)算力中心向智能化AI工廠的智算最高全面轉(zhuǎn)型。
此次發(fā)布會同步推出多款新品,平臺包括基于英特爾至強6處理器的訓(xùn)練新一代高端大模型訓(xùn)練AI服務(wù)器——聯(lián)想問天WA8080a G5,以及全新升級的時間聯(lián)想萬全異構(gòu)智算平臺4.0。
該平臺在大模型預(yù)訓(xùn)練、可縮后訓(xùn)練、聯(lián)想推理及超智融合計算四大場景均實現(xiàn)性能突破,發(fā)布部分訓(xùn)練場景中訓(xùn)練時間最高可縮短50%。異構(gòu)
在異構(gòu)算力調(diào)度與一體化方面,智算最高聯(lián)想智能算力平臺已實現(xiàn)對計算資源的平臺統(tǒng)一抽象與高效調(diào)度,成功驗證訓(xùn)練與推理任務(wù)的訓(xùn)練資源共享與無縫流轉(zhuǎn)能力。
通信網(wǎng)絡(luò)優(yōu)化方面,時間通過集成先進在網(wǎng)計算技術(shù)與自研RoCE網(wǎng)絡(luò)自動化調(diào)優(yōu)系統(tǒng),平臺不僅滿足了對無損網(wǎng)絡(luò)與通信性能的嚴(yán)苛要求,更實現(xiàn)了高性能網(wǎng)絡(luò)的“開箱即用”。
針對高性能推理場景,聯(lián)想依托自研推理引擎,成功部署并驗證了PD分離架構(gòu)與KV-Cache優(yōu)化技術(shù),在復(fù)雜模型上實現(xiàn)了吞吐量與響應(yīng)時間的顯著提升,完全符合服務(wù)等級協(xié)議(SLA)保障標(biāo)準(zhǔn)。
此次相關(guān)標(biāo)準(zhǔn)的制定與驗證成果的發(fā)布,為高性能訓(xùn)練與推理所需的算力服務(wù)質(zhì)量確立了統(tǒng)一衡量基準(zhǔn),有助于推動行業(yè)規(guī)范性能指標(biāo)與服務(wù)品質(zhì),引導(dǎo)算力基礎(chǔ)設(shè)施與服務(wù)商向體系化、高性能、高可靠方向持續(xù)發(fā)展,進而加速整體產(chǎn)業(yè)升級進程。