-

旨在降低生成式人工智能系统DRAM需求的KIOXIA AiSAQ™技术以开源软件形式发布

软件技术通过使用固态硬盘提高了RAG工作流程中矢量数据库的扩展性和准确性

东京--(BUSINESS WIRE)--(美国商业资讯)-- 世界领先的内存解决方案提供商Kioxia Corporation今天宣布开源发布其新的全存储ANNS乘积量化 (AiSAQ)技术(1)。KIOXIA AiSAQ™软件采用针对固态硬盘优化的新型“近似最近邻”搜索(ANNS)算法,可为检索增强生成(RAG)提供可扩展的性能,并且无需将索引数据放在DRAM中,而是直接在固态硬盘上进行搜索。

生成式人工智能系统需要大量的计算、内存和存储资源。虽然人工智能系统有可能推动各行各业实现变革性突破,但其部署往往需要高昂的成本。RAG是人工智能的一个关键阶段,它利用公司或应用的特定数据完善大型语言模型(LLM)。

RAG的核心组件是一个向量数据库,它能将特定数据累积并转换成数据库中的特征向量。RAG还采用了ANNS算法,该算法可根据累积向量和目标向量之间的相似性,识别出能改进模型的向量。为使RAG有效,它必须快速检索与查询最相关的信息。ANNS算法以往是部署在DRAM中,以实现这些搜索所需的高速性能。

KIOXIA AiSAQ技术可为十亿规模的数据集提供可扩展的高效ANNS解决方案,内存使用量可忽略不计,并具有快速索引切换功能。

KIOXIA AiSAQ技术的主要优势:

  • 允许大型数据库在不依赖有限DRAM资源的情况下运行,从而提高RAG系统的性能。
  • 无需将索引数据加载到DRAM中,从而可立即启动矢量数据库。这支持在同一服务器上的用户特定数据库或应用特定数据库之间进行无缝切换,从而高效交付RAG服务。
  • 通过将索引存储在可在多台服务器之间共享的分解式存储中,对云系统进行了优化。这种方法可针对特定用户或应用程序动态调整矢量数据库搜索性能,并有助于在物理服务器之间快速迁移搜索实例。

Kioxia将其创新KIOXIA AiSAQ技术作为开源软件提供给社区,以此表明该公司对推动人工智能发展的承诺。


(1) 请点击链接查看KIOXIA AiSAQ的开源版本。
https://github.com/kioxiaamerica/aisaq-diskann

*公司名称、产品名称和服务名称可能是第三方公司的商标。

关于Kioxia
Kioxia是全球领先的存储器解决方案供应商,致力于开发、生产和销售闪存和固态硬盘(SSD)。2017年4月,其前身Toshiba Memory从1987年发明NAND闪存的Toshiba Corporation中分拆出来。Kioxia致力于用“记忆”改善世界,提供产品、服务和系统,为客户创造选择,为社会创造基于记忆的价值。Kioxia的创新3D闪存技术BiCS FLASH™ 正在塑造高密度应用的存储未来,包括先进的智能手机、个人电脑、汽车系统、数据中心和生成式人工智能系统。

*本文档中的信息,包括产品价格和规格、服务内容和联系信息,在公告日期是正确的,但如有变更恕不另行通知。

免责声明:本公告之原文版本乃官方授权版本。译文仅供方便了解之用,烦请参照原文,原文版本乃唯一具法律效力之版本。

Contacts

媒体垂询:
Kioxia Corporation
销售战略规划部
Satoshi Shindo / Koji Takahata
电话:+81-3-6478-2404

客户咨询:
Kioxia Group
全球销售办事处
https://www.kioxia.com/en-jp/business/buy/global-sales.html

Kioxia Corporation



Contacts

媒体垂询:
Kioxia Corporation
销售战略规划部
Satoshi Shindo / Koji Takahata
电话:+81-3-6478-2404

客户咨询:
Kioxia Group
全球销售办事处
https://www.kioxia.com/en-jp/business/buy/global-sales.html

More News From Kioxia Corporation

KIOXIA单服务器实现48亿高维向量搜索数据库,借助GPU实现索引构建时间加速7.8倍

东京--(BUSINESS WIRE)--(美国商业资讯)-- Kioxia Corporation今日宣布,凭借其开源的KIOXIA AiSAQ™近似最近邻搜索(ANNS)技术,成功演示在单台服务器上实现48亿向量的高维向量搜索扩展。此外,Kioxia还展示了通过NVIDIA cuVS利用GPU加速,显著缩短索引构建时间的成果。这两项成果标志着检索增强生成(RAG)搜索解决方案取得了重大进展。目前公司正持续开发,以支持超过48亿向量的更大规模部署。 大规模向量数据库的索引构建时间是行业的核心痛点。Kioxia与NVIDIA合作,演示了其在1024维高维向量的KIOXIA AiSAQ索引构建时间上最多20倍的改进,以及端到端构建时间上最多7.8倍的改进。这20倍的改进意味着,构建索引的时间从使用CPU的28.4天缩短至使用4块NVIDIA Hopper GPU的1.4天,端到端测试时间从31天缩短至4天。1 如今,AI应用可依赖存储在固态硬盘上的更大规模向量化信息(可达数百亿向量及以上),而仅靠DRAM即便在十亿级规模下也已不再适用。Kioxia借助KIOXIA AiSAQ技术,实现了...

Kioxia宣布推出针对AI GPU发起式工作负载进行优化的全新固态硬盘型号

东京--(BUSINESS WIRE)--(美国商业资讯)-- Kioxia Corporation今日宣布开发出超高IOPS固态硬盘,这是一款可让GPU直接访问高速闪存、作为AI系统中高带宽内存(HBM)扩展的新型固态硬盘。全新的超高IOPS固态硬盘KIOXIA GP系列专为满足AI和高性能计算日益增长的性能需求而打造,提供更大的GPU可访问内存容量,以加快AI工作负载的数据访问速度。KIOXIA GP系列的评估样品将于2026年底面向指定客户提供。 NVIDIA Storage-Next计划旨在应对未来从计算密集型向数据密集型工作负载的转变,以及对GPU可访问内存空间不断扩大的需求,目前该空间受限于HBM容量。扩展GPU的可用内存空间可支持访问更大的数据集,并通过将更多数据部署在更靠近计算资源的位置来提升GPU利用率。 NVIDIA Storage-Next计划呼吁固态硬盘厂商设计针对GPU发起式AI工作负载进行优化的硬盘。该计划通过让GPU访问基于闪存的内存,有效扩展了HBM容量。Kioxia以KIOXIA GP系列固态硬盘支持NVIDIA的此项计划,该系列产品采用低延迟、高性能...

Kioxia开始提供面向下一代移动应用的UFS 5.0嵌入式闪存设备样品

东京--(BUSINESS WIRE)--(美国商业资讯)-- 全球存储解决方案领域的领军企业Kioxia Corporation今日宣布,已开始出货兼容下一代UFS标准UFS 5.0的嵌入式闪存评估样品(1),该标准目前正由JEDEC制定。(2) UFS 5.0是JEDEC正在开发的嵌入式闪存新标准,旨在满足配备设备端AI功能的高端智能手机等下一代移动设备的性能需求。它在物理层采用MIPI M-PHY 6.0版本,在协议层采用UniPro 3.0版本。M-PHY 6.0版本引入全新HS-GEAR6模式,理论上单通道接口速度最高可达46.6 Gbps;双通道配置下,UFS 5.0可实现约10.8 GB/s的有效读写性能。 此次评估样品搭载了自研的全新UFS 5.0控制器和Kioxia第八代BiCS FLASH™,提供512 GB和1 TB两种容量。产品采用全新设计的封装,尺寸仅为7.5 x 13毫米,有助于节省主板空间和提升设计灵活性。 样品将提供给正在开发兼容UFS 5.0的主机系统的客户,用于性能评估和互操作性测试。 Kioxia将持续在UFS产品中引入全新闪存技术,以满足移动市场...
Back to Newsroom