-

阿联酋技术创新研究所利用新架构革新人工智能语言模型

  • 经Hugging Face独立验证,Falcon Mamba 7B是全球性能第一的开源状态空间语言模型(SSLM)
  • SSLM的内存成本低,无需额外内存即可生成任意长文本块
  • Falcon Mamba 7B还优于传统的Transformer架构模型,如Meta的 Llama 3.1 8B和Mistral的7B
  • 新模型体现了阿布扎比在人工智能研发领域的创新和开拓精神

阿联酋阿布扎比--(BUSINESS WIRE)--(美国商业资讯)-- 技术创新研究所(TII)是全球领先的科研中心和阿布扎比先进技术研究理事会(ATRC)的应用研究支柱。该研究所发布了Falcon系列中的一款新的大型语言机型——Falcon Mamba 7B。经Hugging Face独立验证,新模型是全球性能第一的开源状态空间语言模型(SSLM)。

作为Falcon系列的首款SSLM,它有别于之前所有使用Transformer架构的Falcon模型。新的Falcon Mamba 7B模型是该研究所正在进行的开创性研究及其以开源形式向社区提供突破性工具和产品的又一例证。

ATRC秘书长兼阿联酋总统战略研究和先进技术事务顾问Faisal Al Bannai阁下表示:“Falcon Mamba 7B标志着TII连续第四次获得人工智能模型排名第一,巩固了阿布扎比作为全球人工智能研发中心的地位。这一成就彰显了阿联酋对创新的坚定承诺。”

在Transformer架构模型方面,Falcon Mamba 7B在HuggingFace新引入的基准测试中优于Meta的Llama 3.1 8B、Llama 3 8B和Mistral的7B。同时,在其他SSLM中,Falcon Mamba 7B在旧基准测试中击败了所有其他开源模型,它将成为HuggingFace新的更严苛基准测试排行榜上的第一款模型。

TII首席执行官Najwa Aaraj博士表示:“技术创新研究所继续通过Falcon系列人工智能模型突破技术发展的界限。Falcon Mamba 7B代表了真正的开创性工作,为未来的人工智能创新铺平了道路,这些创新将增强人类的能力并改善生活。”

状态空间模型在理解随时间演变的复杂情况(如一整本书的内容)方面表现极为出色。这是因为SSLM不需要额外的内存来消化如此大量的信息。

另一方面,基于Transformer的模型在记住和使用它们之前处理过的序列信息方面非常高效。这使它们在内容生成等任务中表现出色,然而,由于它们会将每个单词与其他单词进行比较,这就需要大量的计算能力。

SSLM可应用于各种领域,如估计、预测和控制任务。与Transformer架构模型类似,它们在自然语言处理任务中也有出色表现,可应用于机器翻译、文本摘要、计算机视觉和音频处理。

TII人工智能跨中心部门代理首席研究员Hakim Hacid博士表示:“在推出Falcon Mamba 7B之际,我为TII促进其发展的合作生态系统感到自豪。这次发布标志着我们向前迈出了一大步,启发了新的视角,进一步推动了对智能系统的探索。在TII,我们正在突破SSLM和Transformer模型的界限,以激发生成式人工智能领域的更多创新。”

Falcon LLM的下载次数已超过4500万次,证明了该模型的巨大成功。Falcon Mamba 7B将基于TII Falcon License 2.0发布。这是一种基于Apache 2.0的宽松软件许可证,包含一项促进人工智能负责任使用的可接受使用政策。如需了解有关这一新模型的更多信息,请访问FalconLLM.TII.ae。

*来源: AETOSWire

免责声明:本公告之原文版本乃官方授权版本。译文仅供方便了解之用,烦请参照原文,原文版本乃唯一具法律效力之版本。

Contacts

Jennifer Dewan,高级传播总监
Jennifer.dewan@tii.ae

The Technology Innovation Institute



Contacts

Jennifer Dewan,高级传播总监
Jennifer.dewan@tii.ae

More News From The Technology Innovation Institute

阿布扎比TII推出Falcon-H1 Arabic,树立全球阿拉伯语AI模型新标杆

阿拉伯联合酋长国阿布扎比--(BUSINESS WIRE)--(美国商业资讯)-- Technology Innovation Institute(TII)——阿布扎比先进技术研究委员会(Advanced Technology Research Council,ATRC)旗下的应用研究机构——正式发布Falcon-H1 Arabic。这是一款基于混合式Mamba-Transformer架构全新打造的大型语言模型,标志着对以往Transformer架构路线的根本性突破。凭借卓越的综合性能,Falcon-H1 Arabic已在Open Arabic LLM Leaderboard(OALL)上确立其作为当前全球表现最优阿拉伯语AI模型的领先地位。 这一里程碑式的进展使Falcon-H1 Arabic确立为目前市场上表现最为领先的阿拉伯语人工智能模型。该模型在参数规模显著更小的情况下,依然全面超越多款体量数倍于己的同类模型,在准确率、上下文理解能力及语言表征等核心维度上均达到业界最先进水平。 阿联酋总统顾问、先进技术研究委员会(ATRC)秘书长Faisal al Bannai阁下表示:“Fa...

TII推出Falcon Reasoning:全球顶尖70亿参数AI模型,性能超越更大规模模型

阿拉伯联合酋长国阿布扎比--(BUSINESS WIRE)--(美国商业资讯)-- 阿布扎比先进技术研究委员会(ATRC)下属的重要应用研究机构——科技创新研究所(TII)发布新一代AI模型Falcon H1R 7B。该模型以紧凑、高效且开源的形式提供世界一流的推理能力,显著提升了先进AI的普及度。 Falcon H1R 7B仅有70亿个参数,却能够挑战并在多个方面超越全球更大型的开源AI模型,包括微软的Phi 4 Reasoning Plus 14B、阿里巴巴的Qwen3 32B以及英伟达的Nemotron H 47B。此次模型发布再次巩固了TII在高效AI创新领域的领先地位,并强化了阿联酋在全球技术领先国家中与日俱增的影响力。 阿联酋总统顾问兼ATRC秘书长Faisal al Bannai阁下表示: “Falcon H1R体现了阿联酋致力于构建开放、负责任的AI,为国家和全球创造真正价值的承诺。我们将世界一流的推理能力融入紧凑高效的模型,从而以一种推动经济增长、科研领导力和长期技术韧性的方式,扩大先进AI的普及范围。” 测试时推理的突破 Falcon H1R 7B在Falcon H...

阿布扎比TII与NVIDIA启动中东首个“人工智能与机器人”NVAITC联合研究实验室

阿布扎比,阿拉伯联合酋长国--(BUSINESS WIRE)--(美国商业资讯)-- 阿布扎比先进技术研究委员会(ATRC)的应用研究机构——技术创新研究院(TII),与全球加速计算和人工智能领导者NVIDIA强强联手,共同创立中东首个专注于人工智能与机器人技术的联合实验室。这一里程碑式的合作将在该地区打造前所未有的创新中心,致力于开发下一代人工智能模型、机器人平台及人形机器人技术,加速各行各业的创新。 TII-NVAITC(NVIDIA人工智能技术中心)人工智能与机器人联合实验室签约仪式在TII阿布扎比总部举行,双方高层代表共同见证这一重要时刻。TII首席执行官Najwa Aaraj博士与NVIDIA中东、土耳其和非洲地区企业业务区域总监Marc Domenech签署合作协议,ATRC总干事Shahab Abu Shahab阁下、ATRC支持服务执行董事Abdulaziz Al Dosari阁下、NVIDIA HPC/超级计算销售与业务发展全球副总裁John Josephakis、NVIDIA全球人工智能技术中心主管Simon See等嘉宾共同出席,本次合作标志着阿联酋人工智能与机器...
Back to Newsroom