-

芯原超低能耗NPU可為行動端大語言模型推理提供超40 TOPS算力

具備高能效比的架構,廣泛適用于智慧型手機和AI PC等終端設備

中國上海--(BUSINESS WIRE)--(美國商業資訊)-- 芯原股份(芯原,股票代號:688521.SH)今日宣布其超低能耗且高效能的神經網路處理器(NPU)IP現已支援在行動端進行大語言模型(LLM)推理,AI算力可擴充至40 TOPS以上。該高能效NPU架構專為滿足行動平台與日俱增的生成式AI需求而設計,不僅能夠為AI PC等終端設備提供強勁算力支援,而且能夠因應智慧型手機等行動終端對低能耗更為嚴苛的挑戰。

芯原的超低能耗NPU IP具備高度可設定、可擴充的架構,支援混合精確度運算、稀疏化最佳化和並行處理。其設計融合了高效的記憶體管理與稀疏感知加速技術,顯著降低運算負載與延遲,確保AI處理流暢、回應迅速。該NPU支援數百種AI演算法,如AI雜訊抑制(AI-NR)和AI超分(AI-SR)等,並與Stable Diffusion和LLaMA-7B等主流AI模型相容。同時,該NPU IP還可與芯原其他處理器IP順暢整合,實現異構運算,協助SoC設計者打造滿足多元化應用需求的AI解決方案。

此外,芯原的超低能耗NPU IP還支援TensorFlow Lite、ONNX和PyTorch等主流AI架構,可加快客戶在不同AI應用場景中的部署進程並簡化整合工作。

芯原策略長、執行副總裁、IP事業部總經理戴偉進表示:「智慧型手機等行動裝置正逐步演變為個人AI伺服器。隨著生成式AI(AIGC)和多模態大語言模型技術的快速發展,市場對AI算力的需求呈指數級成長,並已成為行動產品的關鍵差異化要素。在支援高強度AI運算負載的過程中,能耗控制是最關鍵的挑戰之一。芯原持續深耕針對智慧型手機和AI PC的超低能耗的NPU研發,並透過與主流SoC合作夥伴的密切協作,見證了該技術在下一代智慧型手機和AI PC中實現量產。」

關於芯原

芯原微電子(上海)股份有限公司(芯原股份,688521.SH)是一家憑藉自主半導體IP,為客戶提供平台化、全方位、一站式晶片客製化服務和半導體IP授權服務的企業。如欲瞭解更多資訊,請造訪:http://www.verisilicon.com

免責聲明:本公告之原文版本乃官方授權版本。譯文僅供方便瞭解之用,煩請參照原文,原文版本乃唯一具法律效力之版本。

Contacts

媒體聯絡:press@verisilicon.com

More News From VeriSilicon

芯原推出經市場驗證的ZSP5000視覺核心系列,擴充其針對邊緣智慧的數位訊號處理器IP組合

中國上海--(BUSINESS WIRE)--(美國商業資訊)-- (美國商業資訊)--芯原股份(芯原,股票代號:688521.SH)今日正式發表ZSP5000系列IP。該產品線以公司第五代經矽驗證的數位訊號處理器(DSP)架構為基礎,採用高可擴充性和低功耗的設計,並針對電腦視覺、內建式人工智慧等運算密集型應用進行了深度最佳化,結合架構的可設定能力,該系列IP可為各類邊緣裝置提供兼具能效優勢和運算效率的優秀解決方案。 ZSP5000系列包含ZSP5000、ZSP5000UL、ZSP5000L及ZSP5000H等IP,提供每週期32至256次8位乘積累加運算(MAC)的可擴充向量處理能力。針對更高的效能需求,芯原採用多核架構的ZSP5400H還可透過整合多個ZSP5000H內核來進一步提升運算能力。 ZSP5000系列IP具有豐富且直覺式的指令集,該指令集經過最佳化,可提高程式設計的便利性並支援高效的效能調優。其專用指令可加快常見的影像和訊號處理任務,包括向量與標量運算、水準歸約、排列、移位、查表、限幅及均值運算。ZSP5000系列IP還整合了ZTurbo輔助處理器介面,便於客戶在同一流...

芯原可擴充的高效能GPGPU-AI運算IP賦能汽車與邊緣伺服器AI解決方案

中國上海--(BUSINESS WIRE)--(美國商業資訊)-- (美國商業資訊)-- 芯原股份(芯原,股票代號:688521.SH)今日宣布其高效能、可擴充的GPGPU-AI運算IP的最新進展,這些IP現已為下一代汽車電子和邊緣伺服器應用提供強勁賦能。透過將可程式化平行運算能力與人工智慧(AI)加速器相融合,這些IP在熱和功耗受限的環境下,能夠高效支援大語言模型(LLM)推理、多模態感知以及即時決策等複雜的AI工作負載。 芯原的GPGPU-AI運算IP以高效能通用圖形處理器(GPGPU)架構為基礎,並整合專用AI加速器,可為AI應用提供卓越的運算能力。其可程式化AI加速器與稀疏感知運算引擎透過先進的排程技術,可加快以Transformer架構為基礎的矩陣密集型模型的運行。此外,這些IP支援用於混合精確度運算的多種資料格式,包括INT4/8、FP4/8、BF16、FP16/32/64和TF32,並支援多種高頻寬介面,包括3D堆疊記憶體、LPDDR5X、HBM、PCIe Gen5/Gen6和CXL。該IP還支援多晶片、多卡擴充部署,具備系統級可擴充性,滿足大規模AI應用的部署需求。 芯...

芯原AI-ISP晶片客製化方案協助客戶智慧型手機量產出貨

中國上海--(BUSINESS WIRE)--(美國商業資訊)-- 芯原股份(芯原,股票代號:688521.SH)近日宣布其AI-ISP晶片客製化方案經由客戶的智慧型手機產品已量產出貨,再次彰顯了芯原在AI視覺處理領域的一站式晶片客製化服務能力。 芯原的AI-ISP客製化晶片方案可整合自有或第三方的神經網路處理器(NPU)IP和影像訊號處理器(ISP)IP,透過將傳統影像處理技術與人工智慧演算法相結合,可顯著提升影像與視訊的清晰度、動態範圍及環境適應能力等。該方案還可靈活選用RISC-V或Arm架構處理器,支援MIPI影像輸入/輸出介面,具備LPDDR5/4X記憶體整合能力,並與UART、I2C、SDIO等常用週邊設備連接埠相容,可靈活部署于智慧型手機、安防監控與汽車電子等多種裝置中。 在此次合作中,芯原根據客戶需求,客製化設計了採用RISC-V架構的低功耗AI-ISP系統級晶片(SoC),並提供了以FreeRTOS為基礎的即時處理軟體開發工具組(SDK)。該晶片方案與客戶主晶片平台深度適配,成功應用於其多款智慧終端機產品並實現大規模量產,充分驗證了芯原在異構運算、軟硬體協同最佳化、系...
Back to Newsroom