-

以開放原始碼軟體形式推出的KIOXIA AiSAQ™技術旨在降低生成式AI系統中的DRAM需求

該軟體技術透過使用SSD提高了RAG工作流中的向量資料庫擴充和準確性

東京--(BUSINESS WIRE)--(美國商業資訊)-- 記憶體解決方案領域的全球領導者Kioxia Corporation今天宣布推出全新全儲存ANNS和乘積量化(AiSAQ)技術的開放原始碼版本(1)。KIOXIA AiSAQ™軟體採用針對SSD進行最佳化的新型「近似最近鄰」搜尋(ANNS)演算法,可為檢索強化生成(RAG)提供可擴充的效能,無需將索引資料放入DRAM中,而是直接在SSD上搜尋。

生成式AI系統需要大量的運算、記憶體和儲存資源。儘管它們有可能推動各個產業的變革性突破,但其部署通常伴隨著高昂的成本。RAG是AI的一個關鍵階段,它使用特定于公司或應用程式的資料來促成大型語言模型(LLM)的最佳化。

RAG的一個核心元件是向量資料庫,它累積特定資料並將其轉換為資料庫中的特徵向量。RAG還利用了ANNS演算法,該演算法根據累積向量和目標向量之間的相似性來辨識可改進模型的向量。要使RAG發揮效力,它必須能夠快速檢索與查詢最相關的資訊。ANNS演算法過去一直部署在DRAM中,以實現這些搜尋所需的高速效能。

KIOXIA AiSAQ技術為數十億規模的資料集提供了可擴充且高效的ANNS解決方案,記憶體使用量可忽略不計,並且具有快速索引切換功能。

KIOXIA AiSAQ技術的主要優勢:

  • 允許大規模資料庫在不依賴有限DRAM資源的情況下運行,從而提高RAG系統的效能。
  • 無需將索引資料載入到DRAM中,使向量資料庫能夠立即啟動,從而支援在同一台伺服器上的使用者特定資料庫或應用程式特定資料庫之間順暢切換,以實現高效的RAG服務交付。
  • 將索引儲存在分散式儲存庫中以便在多個伺服器之間共用,從而針對雲端系統進行最佳化。這種方法可以動態調整特定使用者或應用程式的向量資料庫搜尋效能,並有助於在實體伺服器之間快速移轉搜尋執行個體。

Kioxia透過將其創新的KIOXIA AiSAQ技術以開放原始碼軟體的形式貢獻給社群,展示了其對推動AI發展的承諾。


(1) 請點選KIOXIA AiSAQ開放原始碼版本的連結。
https://github.com/kioxiaamerica/aisaq-diskann

*公司名稱、產品名稱和服務名稱可能第三方公司的商標。

關於Kioxia
Kioxia是全球記憶體解決方案領域的領軍企業,致力於快閃記憶體和固態硬碟(SSD)的開發、生產和銷售。其前身是Toshiba Memory,於2017年4月從1987年發明了NAND快閃記憶體的公司Toshiba Corporation脫售而出。Kioxia致力於透過提供產品、服務和系統來為客戶創造選擇,並為社會創造以儲存技術為基礎的價值,從而提升世界的「記憶」。Kioxia創新的3D快閃記憶體技術BiCS FLASH™正在塑造儲存技術在高密度應用領域(包括高階智慧型手機、PC、汽車系統、資料中心和生成式AI系統)的未來。

*本文件中的資訊,包括產品價格和規格、服務內容和聯絡資訊,在公告日期是正確的,但如有變更恕不另行通知。

免責聲明:本公告之原文版本乃官方授權版本。譯文僅供方便瞭解之用,煩請參照原文,原文版本乃唯一具法律效力之版本。

Contacts

媒體查詢:
Kioxia Corporation
銷售策略規劃部
Satoshi Shindo / Koji Takahata
電話:+81-3-6478-2404

客戶查詢:
Kioxia Group
全球銷售辦事處
https://www.kioxia.com/en-jp/business/buy/global-sales.html

Kioxia Corporation



Contacts

媒體查詢:
Kioxia Corporation
銷售策略規劃部
Satoshi Shindo / Koji Takahata
電話:+81-3-6478-2404

客戶查詢:
Kioxia Group
全球銷售辦事處
https://www.kioxia.com/en-jp/business/buy/global-sales.html

More News From Kioxia Corporation

KIOXIA單伺服器實現48億高維度向量搜尋資料庫,藉助GPU實現索引建構時間加快7.8倍

東京--(BUSINESS WIRE)--(美國商業資訊)-- Kioxia Corporation今日宣布,憑藉其開放原始碼的KIOXIA AiSAQ™近似最近鄰搜尋(ANNS)技術,成功示範在單台伺服器上實現48億向量的高維度向量搜尋擴充。此外,Kioxia還展示了透過NVIDIA cuVS利用GPU加速,顯著縮短索引建構時間的成果。這兩項成果代表檢索強化生成(RAG)搜尋解決方案取得了重大進展。目前公司正持續開發,以支援超過48億向量的更大規模部署。 大規模向量資料庫的索引建構時間是產業的核心痛點。Kioxia與NVIDIA合作,示範其在1024維度高維度向量的KIOXIA AiSAQ索引建構時間上最多20倍的改進,以及端對端建構時間上最多7.8倍的改進。這20倍的改進表示,建構索引的時間從使用CPU的28.4天縮短至使用4塊NVIDIA Hopper GPU的1.4天,端對端測試時間從31天縮短至4天。1 如今,AI應用程式可依賴儲存在固態硬碟上的更大規模向量化資訊(可達數百億向量及以上),而僅靠DRAM即便在十億級規模下也已不再適用。Kioxia藉助KIOXIA AiSAQ技...

Kioxia宣布推出針對AI GPU啟動式工作負載進行最佳化的全新固態硬碟型號

東京--(BUSINESS WIRE)--(美國商業資訊)-- Kioxia Corporation今日宣布開發出超高IOPS固態硬碟,這是一款可讓GPU直接存取高速快閃記憶體、充當AI系統中高頻寬記憶體(HBM)擴充的新型固態硬碟。全新的超高IOPS固態硬碟KIOXIA GP系列專為滿足AI和高效能運算與日俱增的效能需求而打造,提供更大的GPU可存取記憶體容量,以加快AI工作負載的資料存取速度。KIOXIA GP系列的評估樣品將於2026年底向指定客戶提供。 NVIDIA Storage-Next計畫旨在因應未來從運算密集型向資料密集型工作負載的改變,以及對GPU可存取記憶體空間不斷擴大的需求,目前該空間受限於HBM容量。擴充GPU的可用記憶體空間可支援存取更大的資料集,並透過將更多資料部署在更靠近運算資源的位置來提升GPU利用率。 NVIDIA Storage-Next計畫呼籲固態硬碟廠商設計針對GPU啟動式AI工作負載進行最佳化的硬碟。該計畫透過讓GPU存取以快閃記憶體為基礎的記憶體,有效擴充了HBM容量。Kioxia以KIOXIA GP系列固態硬碟支援NVIDIA的此項計畫,該...

Kioxia開始提供針對下一代行動應用的UFS 5.0內建式快閃記憶體裝置樣品

東京--(BUSINESS WIRE)--(美國商業資訊)-- 全球記憶體解決方案領域的領軍企業Kioxia Corporation今日宣布,已開始出貨與下一代UFS標準UFS 5.0相容的內建式快閃記憶體評估樣品(1),該標準目前正由JEDEC制定。(2) UFS 5.0是JEDEC正在開發的內建式快閃記憶體新基準,旨在滿足配備裝置端AI功能的高階智慧型手機等下一代行動裝置的效能需求。它在實體層採用MIPI M-PHY 6.0版本,在協議層採用UniPro 3.0版本。M-PHY 6.0版本引進全新HS-GEAR6模式,理論上單通道介面速度最高可達46.6 Gbps;雙通道設定下,UFS 5.0可實現約10.8 GB/s的有效讀寫效能。 此次評估樣品搭載了自研的全新UFS 5.0控制器和Kioxia第八代BiCS FLASH™,提供512 GB和1 TB兩種容量。產品採用全新設計的封裝,尺寸僅為7.5 x 13公釐,有助於節省主機板空間和提升設計靈活性。 樣品將提供給正在開發與UFS 5.0相容的主機系統的客戶,用於效能評估和相互操作性測試。 Kioxia將持續在UFS產品中引進全新...
Back to Newsroom