安謀科技發(fā)布NPU IP“周易”X3 驅(qū)動架構(gòu)革新再定義端側(cè)AI
2025年11月13日,周易安謀科技Arm China在上海隆重發(fā)布新一代NPU IP“周易”X3。安謀作為專為大模型時代打造的科技尖端產(chǎn)品,采用革命性的發(fā)布DSP+DSA混合架構(gòu),具備全面精度支持與多項自研硬件加速技術(shù),驅(qū)動致力于為智能汽車、架構(gòu)移動終端、革新智能物聯(lián)網(wǎng)等關(guān)鍵領域注入強大AI算力,再定提升端側(cè)計算效率,義端推動邊緣AI規(guī)?;渴?。周易
一、安謀架構(gòu)革新:專為大模型而生,科技開啟浮點計算新紀元
“周易”X3的發(fā)布核心突破在于其底層架構(gòu)的徹底革新。它采用了專為應對復雜大模型計算挑戰(zhàn)而設計的驅(qū)動最新DSP+DSA架構(gòu),實現(xiàn)了從傳統(tǒng)定點計算向高性能浮點計算的架構(gòu)關(guān)鍵跨越。該架構(gòu)支持靈活的算力配置,單計算集群Cluster可提供高達8-80 FP8 TFLOPS的算力,同時單核心Core帶寬飆升至256GB/s,為數(shù)據(jù)密集型的大模型應用提供了堅實的數(shù)據(jù)吞吐保障。
尤為關(guān)鍵的是,“周易”X3原生支持了端側(cè)高效運行大模型所必需的W4A8與W4A16計算加速模式。通過對模型權(quán)重進行低比特量化,有效大幅降低了內(nèi)存帶寬消耗,打通了云端大模型向資源受限的端側(cè)設備高效遷移的技術(shù)路徑。
二、性能飛躍:算力密度與效率雙提升,大模型能力激增十倍
得益于架構(gòu)的根本性升級,“周易”X3在性能上實現(xiàn)了質(zhì)的飛躍。官方數(shù)據(jù)顯示,相較于前代“周易”X2,新一代“周易”X3在處理廣泛應用的CNN模型時,性能提升高達30%至50%。更為驚人的是,在相同算力規(guī)格下,其AIGC大模型處理能力實現(xiàn)了10倍級的跨越式增長。這一驚人表現(xiàn),源于其16倍的FP16 TFLOPS算力提升、4倍的計算核心帶寬增長,及超過10倍的Softmax和LayerNorm關(guān)鍵運算性能強化。實測標明,多核協(xié)同工作的算力線性度達到了優(yōu)異的70%-80%,確保了算力的高效利用。
在實際大模型推理測試中,“周易”X3的表現(xiàn)同樣耀眼。在運行Llama2 7B等主流大模型時,其預填充Prefill階段的算力利用率高達72%,而在關(guān)鍵的解碼Decode階段,在安謀科技自研解壓硬件WDC的加持下,有效帶寬利用率更是突破了100%,遠超行業(yè)平均水平,充分釋放了硬件的潛在算力,為大模型在端側(cè)的流暢運行提供了極致性能保障。
三、關(guān)鍵技術(shù)突破:四大核心引擎,精準破解端側(cè)AI難題
“周易”X3并非簡單的性能堆砌,而是通過一系列集成化的硬件創(chuàng)新,精準解決了端側(cè)部署AI大模型面臨的帶寬、調(diào)度、精度適配等核心難題。
“周易”X3搭載自研解壓硬件WDC,創(chuàng)新性地集成了權(quán)重解壓硬件單元,支持對大模型權(quán)重進行軟件無損壓縮后直接硬件解壓,帶來約15%的等效帶寬提升,有效緩解了內(nèi)存墻壓力。同時,集成的AI專屬硬件引擎AIFF與專用硬化調(diào)度器,將CPU負載降至0.5%以下,并顯著降低了任務調(diào)度延遲。這使得NPU在并行處理多路AI任務時,即使在高優(yōu)先級任務需即時響應的復雜場景下,仍能保持系統(tǒng)流暢高效運行。
“周易”X3還支持int4/int8/int16/int32/fp4/fp8/fp16/bf16/fp32等多精度融合計算與強浮點運算能力。憑借其全面的整數(shù)與浮點計算支持,該NPU IP能夠無縫適配從傳統(tǒng)CNN模型到前沿Transformer大模型的多樣化計算需求,在智能手機邊緣推理、AI PC、智能汽車等不同應用中實現(xiàn)性能與能效的精準平衡。此外,新增的端側(cè)大模型必備W4A8/W4A16計算加速模式,可對模型權(quán)重進行低比特量化,大幅降低帶寬消耗,有效支持云端大模型向端側(cè)的高效遷移。
寫在最后
安謀科技Arm China “周易”X3 NPU IP的發(fā)布,標志著端側(cè)AI計算能力邁上了一個全新臺階。其兼具高性能、高能效與高靈活性的特點,將直接賦能智能汽車、移動終端、智能物聯(lián)網(wǎng)、基礎設施等領域。配合其成熟易用的“周易”NPU Compass AI軟件平臺,構(gòu)成了一個完整的軟硬件一體化解決方案,將極大降低開發(fā)門檻,推動創(chuàng)新AI應用在各行各業(yè)的快速孵化和部署。
