-

阿联酋技术创新研究所利用新架构革新人工智能语言模型

  • 经Hugging Face独立验证,Falcon Mamba 7B是全球性能第一的开源状态空间语言模型(SSLM)
  • SSLM的内存成本低,无需额外内存即可生成任意长文本块
  • Falcon Mamba 7B还优于传统的Transformer架构模型,如Meta的 Llama 3.1 8B和Mistral的7B
  • 新模型体现了阿布扎比在人工智能研发领域的创新和开拓精神

阿联酋阿布扎比--(BUSINESS WIRE)--(美国商业资讯)-- 技术创新研究所(TII)是全球领先的科研中心和阿布扎比先进技术研究理事会(ATRC)的应用研究支柱。该研究所发布了Falcon系列中的一款新的大型语言机型——Falcon Mamba 7B。经Hugging Face独立验证,新模型是全球性能第一的开源状态空间语言模型(SSLM)。

作为Falcon系列的首款SSLM,它有别于之前所有使用Transformer架构的Falcon模型。新的Falcon Mamba 7B模型是该研究所正在进行的开创性研究及其以开源形式向社区提供突破性工具和产品的又一例证。

ATRC秘书长兼阿联酋总统战略研究和先进技术事务顾问Faisal Al Bannai阁下表示:“Falcon Mamba 7B标志着TII连续第四次获得人工智能模型排名第一,巩固了阿布扎比作为全球人工智能研发中心的地位。这一成就彰显了阿联酋对创新的坚定承诺。”

在Transformer架构模型方面,Falcon Mamba 7B在HuggingFace新引入的基准测试中优于Meta的Llama 3.1 8B、Llama 3 8B和Mistral的7B。同时,在其他SSLM中,Falcon Mamba 7B在旧基准测试中击败了所有其他开源模型,它将成为HuggingFace新的更严苛基准测试排行榜上的第一款模型。

TII首席执行官Najwa Aaraj博士表示:“技术创新研究所继续通过Falcon系列人工智能模型突破技术发展的界限。Falcon Mamba 7B代表了真正的开创性工作,为未来的人工智能创新铺平了道路,这些创新将增强人类的能力并改善生活。”

状态空间模型在理解随时间演变的复杂情况(如一整本书的内容)方面表现极为出色。这是因为SSLM不需要额外的内存来消化如此大量的信息。

另一方面,基于Transformer的模型在记住和使用它们之前处理过的序列信息方面非常高效。这使它们在内容生成等任务中表现出色,然而,由于它们会将每个单词与其他单词进行比较,这就需要大量的计算能力。

SSLM可应用于各种领域,如估计、预测和控制任务。与Transformer架构模型类似,它们在自然语言处理任务中也有出色表现,可应用于机器翻译、文本摘要、计算机视觉和音频处理。

TII人工智能跨中心部门代理首席研究员Hakim Hacid博士表示:“在推出Falcon Mamba 7B之际,我为TII促进其发展的合作生态系统感到自豪。这次发布标志着我们向前迈出了一大步,启发了新的视角,进一步推动了对智能系统的探索。在TII,我们正在突破SSLM和Transformer模型的界限,以激发生成式人工智能领域的更多创新。”

Falcon LLM的下载次数已超过4500万次,证明了该模型的巨大成功。Falcon Mamba 7B将基于TII Falcon License 2.0发布。这是一种基于Apache 2.0的宽松软件许可证,包含一项促进人工智能负责任使用的可接受使用政策。如需了解有关这一新模型的更多信息,请访问FalconLLM.TII.ae。

*来源: AETOSWire

免责声明:本公告之原文版本乃官方授权版本。译文仅供方便了解之用,烦请参照原文,原文版本乃唯一具法律效力之版本。

Contacts

Jennifer Dewan,高级传播总监
Jennifer.dewan@tii.ae

The Technology Innovation Institute



Contacts

Jennifer Dewan,高级传播总监
Jennifer.dewan@tii.ae

More News From The Technology Innovation Institute

阿布扎比TII与NVIDIA启动中东首个“人工智能与机器人”NVAITC联合研究实验室

阿布扎比,阿拉伯联合酋长国--(BUSINESS WIRE)--(美国商业资讯)-- 阿布扎比先进技术研究委员会(ATRC)的应用研究机构——技术创新研究院(TII),与全球加速计算和人工智能领导者NVIDIA强强联手,共同创立中东首个专注于人工智能与机器人技术的联合实验室。这一里程碑式的合作将在该地区打造前所未有的创新中心,致力于开发下一代人工智能模型、机器人平台及人形机器人技术,加速各行各业的创新。 TII-NVAITC(NVIDIA人工智能技术中心)人工智能与机器人联合实验室签约仪式在TII阿布扎比总部举行,双方高层代表共同见证这一重要时刻。TII首席执行官Najwa Aaraj博士与NVIDIA中东、土耳其和非洲地区企业业务区域总监Marc Domenech签署合作协议,ATRC总干事Shahab Abu Shahab阁下、ATRC支持服务执行董事Abdulaziz Al Dosari阁下、NVIDIA HPC/超级计算销售与业务发展全球副总裁John Josephakis、NVIDIA全球人工智能技术中心主管Simon See等嘉宾共同出席,本次合作标志着阿联酋人工智能与机器...

Technology Innovation Institute 与 AI71 携手 Amazon Web Services,共同推动阿联酋及全球 AI 创新发展

阿布扎比,阿联酋--(BUSINESS WIRE)--(美国商业资讯)-- 阿布扎比 Technology Innovation Institute(TII)是全球领先的 Falcon 系列人工智能模型及安全隐私解决方案的创造者,AI71 是阿布扎比领先的人工智能公司,专注于提供定制化企业 AI 产品。两家机构正与 Amazon Web Services(AWS)合作,扩大对阿联酋制造的人工智能模型和解决方案的访问。 通过整合 TII 在大语言模型(LLM)领域的技术专长、AI71 在 AI 智能助手构建方面的深厚经验,以及 AWS 全球领先的云端人工智能与机器学习服务,全球专业用户将能便捷获取 Falcon 系列及高度定制的 AI 解决方案,改变人们的生活与工作方式。 目前,TII 已通过 Amazon SageMaker 提供多个 Falcon 大语言模型,最新的模型也即将在 Amazon Bedrock Marketplace 上架。Falcon 系列覆盖多种规格的大模型,在全球大模型排行榜中名列前茅,能为各类 AI 需求提供可扩展的解决方案。企业与开发者可通过即用即付 API...

中东领先的人工智能巨头TII推出两款全新人工智能模型:Falcon系列首款阿拉伯语模型Falcon Arabic,以及同类最佳高性能模型Falcon-H1

阿拉伯联合酋长国阿布扎比--(BUSINESS WIRE)--(美国商业资讯)-- 阿布扎比先进技术研究协会(ARTC)下属的科技创新研究所(TII)今天发布了两项重大人工智能进展:Falcon Arabic是Falcon系列首款阿拉伯语模型,现已成为该地区表现最佳的阿拉伯语人工智能模型,而Falcon-H1则是一款通过全新架构设计重新定义了性能和可移植性的新模型。在中小型人工智能模型(300亿至700亿个参数)中,Falcon-H1的性能超越了Meta的LlaMA和阿里巴巴的Qwen等竞品,可在日常设备和资源有限的环境中实现真实世界的人工智能。阿联酋总统顾问兼ATRC秘书长Faisal Al Bannai阁下在“Make it in the Emirates”活动上发表主题演讲时宣布了这一消息。 Falcon Arabic建立在Falcon 3-7B(70亿参数)之上,是迄今为止已开发的最先进的阿拉伯语人工智能模型之一。该模型在涵盖现代标准阿拉伯语和地区方言的高质量母语(非翻译)阿拉伯语数据集上进行训练,全面捕捉了阿拉伯世界的语言多样性。根据开放式阿拉伯语LLM排行榜基准,Falco...
Back to Newsroom