安謀科技發(fā)布NPU IP“周易”X3 驅(qū)動架構革新再定義端側AI
2025年11月13日,周易安謀科技Arm China在上海隆重發(fā)布新一代NPU IP“周易”X3。安謀作為專為大模型時代打造的科技尖端產(chǎn)品,采用革命性的發(fā)布DSP+DSA混合架構,具備全面精度支持與多項自研硬件加速技術,驅(qū)動致力于為智能汽車、架構移動終端、革新智能物聯(lián)網(wǎng)等關鍵領域注入強大AI算力,再定提升端側計算效率,義端推動邊緣AI規(guī)?;渴?。周易
一、安謀架構革新:專為大模型而生,科技開啟浮點計算新紀元
“周易”X3的發(fā)布核心突破在于其底層架構的徹底革新。它采用了專為應對復雜大模型計算挑戰(zhàn)而設計的驅(qū)動最新DSP+DSA架構,實現(xiàn)了從傳統(tǒng)定點計算向高性能浮點計算的架構關鍵跨越。該架構支持靈活的算力配置,單計算集群Cluster可提供高達8-80 FP8 TFLOPS的算力,同時單核心Core帶寬飆升至256GB/s,為數(shù)據(jù)密集型的大模型應用提供了堅實的數(shù)據(jù)吞吐保障。
尤為關鍵的是,“周易”X3原生支持了端側高效運行大模型所必需的W4A8與W4A16計算加速模式。通過對模型權重進行低比特量化,有效大幅降低了內(nèi)存帶寬消耗,打通了云端大模型向資源受限的端側設備高效遷移的技術路徑。
二、性能飛躍:算力密度與效率雙提升,大模型能力激增十倍
得益于架構的根本性升級,“周易”X3在性能上實現(xiàn)了質(zhì)的飛躍。官方數(shù)據(jù)顯示,相較于前代“周易”X2,新一代“周易”X3在處理廣泛應用的CNN模型時,性能提升高達30%至50%。更為驚人的是,在相同算力規(guī)格下,其AIGC大模型處理能力實現(xiàn)了10倍級的跨越式增長。這一驚人表現(xiàn),源于其16倍的FP16 TFLOPS算力提升、4倍的計算核心帶寬增長,及超過10倍的Softmax和LayerNorm關鍵運算性能強化。實測標明,多核協(xié)同工作的算力線性度達到了優(yōu)異的70%-80%,確保了算力的高效利用。
在實際大模型推理測試中,“周易”X3的表現(xiàn)同樣耀眼。在運行Llama2 7B等主流大模型時,其預填充Prefill階段的算力利用率高達72%,而在關鍵的解碼Decode階段,在安謀科技自研解壓硬件WDC的加持下,有效帶寬利用率更是突破了100%,遠超行業(yè)平均水平,充分釋放了硬件的潛在算力,為大模型在端側的流暢運行提供了極致性能保障。
三、關鍵技術突破:四大核心引擎,精準破解端側AI難題
“周易”X3并非簡單的性能堆砌,而是通過一系列集成化的硬件創(chuàng)新,精準解決了端側部署AI大模型面臨的帶寬、調(diào)度、精度適配等核心難題。
“周易”X3搭載自研解壓硬件WDC,創(chuàng)新性地集成了權重解壓硬件單元,支持對大模型權重進行軟件無損壓縮后直接硬件解壓,帶來約15%的等效帶寬提升,有效緩解了內(nèi)存墻壓力。同時,集成的AI專屬硬件引擎AIFF與專用硬化調(diào)度器,將CPU負載降至0.5%以下,并顯著降低了任務調(diào)度延遲。這使得NPU在并行處理多路AI任務時,即使在高優(yōu)先級任務需即時響應的復雜場景下,仍能保持系統(tǒng)流暢高效運行。
“周易”X3還支持int4/int8/int16/int32/fp4/fp8/fp16/bf16/fp32等多精度融合計算與強浮點運算能力。憑借其全面的整數(shù)與浮點計算支持,該NPU IP能夠無縫適配從傳統(tǒng)CNN模型到前沿Transformer大模型的多樣化計算需求,在智能手機邊緣推理、AI PC、智能汽車等不同應用中實現(xiàn)性能與能效的精準平衡。此外,新增的端側大模型必備W4A8/W4A16計算加速模式,可對模型權重進行低比特量化,大幅降低帶寬消耗,有效支持云端大模型向端側的高效遷移。
寫在最后
安謀科技Arm China “周易”X3 NPU IP的發(fā)布,標志著端側AI計算能力邁上了一個全新臺階。其兼具高性能、高能效與高靈活性的特點,將直接賦能智能汽車、移動終端、智能物聯(lián)網(wǎng)、基礎設施等領域。配合其成熟易用的“周易”NPU Compass AI軟件平臺,構成了一個完整的軟硬件一體化解決方案,將極大降低開發(fā)門檻,推動創(chuàng)新AI應用在各行各業(yè)的快速孵化和部署。
-
教育觀察:浙江中小學為什么放“秋假”?低價游戲神U!AMD入門銳龍5 7500X3D首次跑分:僅比7600X3D慢8%全球頂尖“雙金獎”認證!海爾空調(diào)連奪日內(nèi)瓦、紐倫堡發(fā)明展金獎撞擊神二十的空間碎片危害有多大:能對航天器造成致命損傷多部動畫將上線 《羅小黑戰(zhàn)記》回歸,《中國奇譚2》定檔元旦東芝發(fā)布S300 AI系列監(jiān)控硬盤:針對AI負載進行優(yōu)化6.6mm VS 5.6mm!華為Mate 70 Air/蘋果iPhone Air配置對比防范新能源汽車火災風險!全國首個城市級監(jiān)測處置平臺上線:熱失控提前預警Solidigm 為AI打造高性能、高能效的存儲底座華為閱讀新推“書館先生”音色:聽《慶余年》等熱門書如臨說書現(xiàn)場
- ·一出生就15歲 湖南“最老”凍胚試管嬰兒健康狀況良好
- ·北方多地夜空現(xiàn)不明發(fā)光飛行物:不排除人造物體墜落
- ·低價游戲神U!AMD入門銳龍5 7500X3D首次跑分:僅比7600X3D慢8%
- ·最新iOS設備好評榜出爐:iPhone 17 Pro Max不再是第一
- ·(粵港澳全運會)許杰贏得男子花劍個人賽金牌
- ·告別騷擾短信!中國廣電宣布192號段短信免打擾功能上線:設置超簡單
- ·特斯拉國道撞死野豬車主負全責!此前有車主高速上撞野豬獲賠償
- ·對話李倩玲、關雅荻等播客創(chuàng)作者 共探HarmonyOS播客元服務內(nèi)容新布局
- ·華為Mate 80 Pro包裝盒亮相:麒麟9030、麒麟9030 Pro雙芯片
- ·英國21世紀最暢銷車型揭曉:福特兩款車霸榜前二
- ·小米員工曬自家地庫:兩位鄰居跟自己買同款YU7 同一個顏色、同一排車位
- ·威馬汽車開始復活!App重新上線 車主可用手機控車了
- ·小米澎湃OS 3被贊安卓最強手機系統(tǒng) 盧偉冰:繼續(xù)努力
- ·牛津大學研發(fā)出空氣驅(qū)動“無腦”機器人:沒有電子元件也能自主運動
- ·英國21世紀最暢銷車型揭曉:福特兩款車霸榜前二
- ·對話李倩玲、關雅荻等播客創(chuàng)作者 共探HarmonyOS播客元服務內(nèi)容新布局
- ·淘寶閃購聯(lián)合阿里健康上線“居家閃檢”,上門取樣可測12種流感病原
- ·REDMI K90系列開售一周銷量約30萬部 約為上代70%
- ·防范新能源汽車火災風險!全國首個城市級監(jiān)測處置平臺上線:熱失控提前預警
- ·史上最薄Mate直板機!華為Mate70 Air正式官宣:今日預售
- ·閉麥 45 天扎一線!賈國龍帶隊優(yōu)化西貝現(xiàn)制場景 核心城市重迎排隊潮
- ·XXXL號月亮來了!今晚將迎來本年度最大滿月:最佳賞月時間出爐
- ·索尼Xperia公眾號已注銷:一個時代終結
- ·小米17確實賣爆!Q3中國手機市場排名:vivo第一 華為小米緊隨其后
- ·夸克宣布接入千問對話助手,將發(fā)布新AI瀏覽器
- ·我國航天器首次!天問一號觀測到星際天體阿特拉斯:比太陽系年齡還老
- ·2025年新玉米:劉老桿東北甜糯玉米17元8穗大促
- ·北美長頸鹿變混血 基因不純失去保護價值:或成“同事”食物
- ·中國科學家破解140年難題:動輒百萬起抗癌藥成本有望斷崖下降!
- ·北美長頸鹿變混血 基因不純失去保護價值:或成“同事”食物
- ·金士頓推出Dual Portable雙接口移動固態(tài)硬盤
- ·一輛小米SU7轉彎時避讓行人 因車速過快甩尾撞車
- ·出人意料!AMD CEO蘇姿豐確認:Instinct MI308 AI芯片獲準對華出口
- ·撞擊神二十的空間碎片危害有多大:能對航天器造成致命損傷
- ·教育觀察:浙江中小學為什么放“秋假”?
- ·北方多地夜空現(xiàn)不明發(fā)光飛行物:不排除人造物體墜落
