-

以開放原始碼軟體形式推出的KIOXIA AiSAQ™技術旨在降低生成式AI系統中的DRAM需求

該軟體技術透過使用SSD提高了RAG工作流中的向量資料庫擴充和準確性

東京--(BUSINESS WIRE)--(美國商業資訊)-- 記憶體解決方案領域的全球領導者Kioxia Corporation今天宣布推出全新全儲存ANNS和乘積量化(AiSAQ)技術的開放原始碼版本(1)。KIOXIA AiSAQ™軟體採用針對SSD進行最佳化的新型「近似最近鄰」搜尋(ANNS)演算法,可為檢索強化生成(RAG)提供可擴充的效能,無需將索引資料放入DRAM中,而是直接在SSD上搜尋。

生成式AI系統需要大量的運算、記憶體和儲存資源。儘管它們有可能推動各個產業的變革性突破,但其部署通常伴隨著高昂的成本。RAG是AI的一個關鍵階段,它使用特定于公司或應用程式的資料來促成大型語言模型(LLM)的最佳化。

RAG的一個核心元件是向量資料庫,它累積特定資料並將其轉換為資料庫中的特徵向量。RAG還利用了ANNS演算法,該演算法根據累積向量和目標向量之間的相似性來辨識可改進模型的向量。要使RAG發揮效力,它必須能夠快速檢索與查詢最相關的資訊。ANNS演算法過去一直部署在DRAM中,以實現這些搜尋所需的高速效能。

KIOXIA AiSAQ技術為數十億規模的資料集提供了可擴充且高效的ANNS解決方案,記憶體使用量可忽略不計,並且具有快速索引切換功能。

KIOXIA AiSAQ技術的主要優勢:

  • 允許大規模資料庫在不依賴有限DRAM資源的情況下運行,從而提高RAG系統的效能。
  • 無需將索引資料載入到DRAM中,使向量資料庫能夠立即啟動,從而支援在同一台伺服器上的使用者特定資料庫或應用程式特定資料庫之間順暢切換,以實現高效的RAG服務交付。
  • 將索引儲存在分散式儲存庫中以便在多個伺服器之間共用,從而針對雲端系統進行最佳化。這種方法可以動態調整特定使用者或應用程式的向量資料庫搜尋效能,並有助於在實體伺服器之間快速移轉搜尋執行個體。

Kioxia透過將其創新的KIOXIA AiSAQ技術以開放原始碼軟體的形式貢獻給社群,展示了其對推動AI發展的承諾。


(1) 請點選KIOXIA AiSAQ開放原始碼版本的連結。
https://github.com/kioxiaamerica/aisaq-diskann

*公司名稱、產品名稱和服務名稱可能第三方公司的商標。

關於Kioxia
Kioxia是全球記憶體解決方案領域的領軍企業,致力於快閃記憶體和固態硬碟(SSD)的開發、生產和銷售。其前身是Toshiba Memory,於2017年4月從1987年發明了NAND快閃記憶體的公司Toshiba Corporation脫售而出。Kioxia致力於透過提供產品、服務和系統來為客戶創造選擇,並為社會創造以儲存技術為基礎的價值,從而提升世界的「記憶」。Kioxia創新的3D快閃記憶體技術BiCS FLASH™正在塑造儲存技術在高密度應用領域(包括高階智慧型手機、PC、汽車系統、資料中心和生成式AI系統)的未來。

*本文件中的資訊,包括產品價格和規格、服務內容和聯絡資訊,在公告日期是正確的,但如有變更恕不另行通知。

免責聲明:本公告之原文版本乃官方授權版本。譯文僅供方便瞭解之用,煩請參照原文,原文版本乃唯一具法律效力之版本。

Contacts

媒體查詢:
Kioxia Corporation
銷售策略規劃部
Satoshi Shindo / Koji Takahata
電話:+81-3-6478-2404

客戶查詢:
Kioxia Group
全球銷售辦事處
https://www.kioxia.com/en-jp/business/buy/global-sales.html

Kioxia Corporation



Contacts

媒體查詢:
Kioxia Corporation
銷售策略規劃部
Satoshi Shindo / Koji Takahata
電話:+81-3-6478-2404

客戶查詢:
Kioxia Group
全球銷售辦事處
https://www.kioxia.com/en-jp/business/buy/global-sales.html

More News From Kioxia Corporation

Kioxia推出UFS 4.1版本內建式快閃記憶體裝置樣品

東京--(BUSINESS WIRE)--(美國商業資訊)-- 全球儲存解決方案領導者Kioxia Corporation今日宣布,已開始提供全新的通用快閃記憶體儲存(2) (UFS) 4.1版本內建式存放裝置樣品,進一步鞏固其在高效能儲存領域的領先地位。這些新裝置專為滿足下一代行動應用程式的需求而設計,包括搭載裝置端AI的先進智慧型手機,它在小型BGA封裝中實現了效能提升與更高的能效(3)。 Kioxia的UFS 4.1版本裝置在JEDEC標準封裝中整合了公司創新的BiCS FLASH™ 3D快閃記憶體和控制器。這些全新UFS裝置採用Kioxia第8代BiCS FLASH™ 3D快閃記憶體(1)打造。該代產品引進了CBA(CMOS直接貼合陣列)技術——這一架構創新代表快閃記憶體設計的重大飛躍。透過將CMOS電路直接貼合至儲存陣列,CBA技術大幅提升了能效、效能和儲存密度。 Kioxia的UFS 4.1版本裝置兼具高速與低功耗特性,旨在提升使用者體驗,實現更快的下載速度和更流暢的應用程式運行表現。 核心特性包括: 提供256 GB、512 GB和1 TB三種容量選擇 效能較上一代產品提...

KIOXIA AiSAQ™軟體推出新版本向量搜尋庫,推動AI檢索增強生成技術發展

東京--(BUSINESS WIRE)--(美國商業資訊)-- 為持續最佳化固態硬碟(SSD)的使用,提升檢索增強生成(RAG)系統中AI向量資料庫搜尋的可用性,全球儲存解決方案領導者Kioxia Corporation今日宣布更新其KIOXIA AiSAQ™(全儲存型乘積量化近似最近鄰搜尋)軟體。此次新開放原始碼版本引進了靈活控制功能,使系統架構師能夠在搜尋效能與向量數量之間定義平衡點——這兩個因素在系統SSD儲存的固定容量中相互制約。這一成果帶來的益處是,RAG系統的架構師無需對硬體進行任何修改,即可針對特定工作負載及其需求精細調整出最佳平衡點。 KIOXIA AiSAQ軟體於2025年1月首次推出,採用專為SSD進行最佳化的新型近似最近鄰搜尋(ANNS)演算法,無需將索引資料儲存在DRAM中。透過支援直接在SSD上進行向量搜尋並降低主機記憶體需求,KIOXIA AiSAQ技術使向量資料庫能夠進行擴充,基本不受DRAM容量限制的影響。 當系統中SSD的安裝容量固定時,提升搜尋效能(每秒查詢數)需要每個向量消耗更多SSD容量,從而導致向量數量減少。反之,若要最大化向量數量,則需減少每...

Kioxia擴充第八代BiCS FLASH™ SSD產品組合,推出高效能資料中心NVMe™ SSD以最大化AI和HPC(高效能運算)工作負載中的GPU利用率

東京--(BUSINESS WIRE)--(美國商業資訊)-- 全球儲存解決方案領導者Kioxia Corporation今日宣布其新型KIOXIA CD9P系列PCIe® 5.0 NVMe™ SSD的原型開發與示範。這些下一代驅動器是以Kioxia第八代BiCS FLASH™ TLC 3D快閃記憶體為基礎打造的最新SSD產品。第八代BiCS FLASH™採用CBA(CMOS直接貼合至陣列)技術,這一突破性架構顯著提升了電源效率、效能和儲存密度[1],同時使每個SSD的可用容量較上一代型號增加了一倍[2]。 隨著GPU加速的AI伺服器對儲存基礎設施的需求不斷攀升,維持高輸送量、低延遲和一致的效能至關重要——包括讓寶貴的GPU始終保持高利用率。KIOXIA CD9P系列專為這些下一代環境設計,提供AI、機器學習和HPC(高效能運算)工作負載所需的速度和回應能力,以確保GPU持續獲得資料供應並以最高效率運行。 CD9P系列利用Kioxia迄今為止最先進的3D快閃記憶體,採用基於CBA的架構,可減少熱量產生、強化熱管理,並透過改進的效能、功耗指標和整體擁有成本提供更高的整體價值。 相較上一代...
Back to Newsroom