-

阿联酋技术创新研究所利用新架构革新人工智能语言模型

  • 经Hugging Face独立验证,Falcon Mamba 7B是全球性能第一的开源状态空间语言模型(SSLM)
  • SSLM的内存成本低,无需额外内存即可生成任意长文本块
  • Falcon Mamba 7B还优于传统的Transformer架构模型,如Meta的 Llama 3.1 8B和Mistral的7B
  • 新模型体现了阿布扎比在人工智能研发领域的创新和开拓精神

阿联酋阿布扎比--(BUSINESS WIRE)--(美国商业资讯)-- 技术创新研究所(TII)是全球领先的科研中心和阿布扎比先进技术研究理事会(ATRC)的应用研究支柱。该研究所发布了Falcon系列中的一款新的大型语言机型——Falcon Mamba 7B。经Hugging Face独立验证,新模型是全球性能第一的开源状态空间语言模型(SSLM)。

作为Falcon系列的首款SSLM,它有别于之前所有使用Transformer架构的Falcon模型。新的Falcon Mamba 7B模型是该研究所正在进行的开创性研究及其以开源形式向社区提供突破性工具和产品的又一例证。

ATRC秘书长兼阿联酋总统战略研究和先进技术事务顾问Faisal Al Bannai阁下表示:“Falcon Mamba 7B标志着TII连续第四次获得人工智能模型排名第一,巩固了阿布扎比作为全球人工智能研发中心的地位。这一成就彰显了阿联酋对创新的坚定承诺。”

在Transformer架构模型方面,Falcon Mamba 7B在HuggingFace新引入的基准测试中优于Meta的Llama 3.1 8B、Llama 3 8B和Mistral的7B。同时,在其他SSLM中,Falcon Mamba 7B在旧基准测试中击败了所有其他开源模型,它将成为HuggingFace新的更严苛基准测试排行榜上的第一款模型。

TII首席执行官Najwa Aaraj博士表示:“技术创新研究所继续通过Falcon系列人工智能模型突破技术发展的界限。Falcon Mamba 7B代表了真正的开创性工作,为未来的人工智能创新铺平了道路,这些创新将增强人类的能力并改善生活。”

状态空间模型在理解随时间演变的复杂情况(如一整本书的内容)方面表现极为出色。这是因为SSLM不需要额外的内存来消化如此大量的信息。

另一方面,基于Transformer的模型在记住和使用它们之前处理过的序列信息方面非常高效。这使它们在内容生成等任务中表现出色,然而,由于它们会将每个单词与其他单词进行比较,这就需要大量的计算能力。

SSLM可应用于各种领域,如估计、预测和控制任务。与Transformer架构模型类似,它们在自然语言处理任务中也有出色表现,可应用于机器翻译、文本摘要、计算机视觉和音频处理。

TII人工智能跨中心部门代理首席研究员Hakim Hacid博士表示:“在推出Falcon Mamba 7B之际,我为TII促进其发展的合作生态系统感到自豪。这次发布标志着我们向前迈出了一大步,启发了新的视角,进一步推动了对智能系统的探索。在TII,我们正在突破SSLM和Transformer模型的界限,以激发生成式人工智能领域的更多创新。”

Falcon LLM的下载次数已超过4500万次,证明了该模型的巨大成功。Falcon Mamba 7B将基于TII Falcon License 2.0发布。这是一种基于Apache 2.0的宽松软件许可证,包含一项促进人工智能负责任使用的可接受使用政策。如需了解有关这一新模型的更多信息,请访问FalconLLM.TII.ae。

*来源: AETOSWire

免责声明:本公告之原文版本乃官方授权版本。译文仅供方便了解之用,烦请参照原文,原文版本乃唯一具法律效力之版本。

Contacts

Jennifer Dewan,高级传播总监
Jennifer.dewan@tii.ae

The Technology Innovation Institute



Contacts

Jennifer Dewan,高级传播总监
Jennifer.dewan@tii.ae

More News From The Technology Innovation Institute

TACTICA AI 推出区域首个面向关键任务场景与实时运营决策的 AI 平台

阿联酋阿布扎比--(BUSINESS WIRE)--(美国商业资讯)-- 总部位于阿布扎比的初创企业 TACTICA AI 今日在 “Make it in the Emirates 2026” 大会上,正式面向更广泛市场发布其多领域决策支持平台。在运营复杂性持续攀升、市场对更快速且更精准决策需求日益迫切的背景下,该平台旨在将碎片化的情报、传感器及运营数据实时转化为可执行决策。 目前,TACTICA AI 已在实际运营场景中投入使用,并被认为是区域内首个公开发布的同类平台。该平台开创了“运营级 AI”这一全新领域,突破传统仪表盘、数据流与分析工具的局限,将 AI 能力进一步延伸至任务执行与运营决策层面。其核心技术由阿布扎比先进技术研究委员会(ATRC)旗下应用研究机构——技术创新研究院(Technology Innovation Institute,TII)在不足 35 天内完成研发,并已在关键任务环境中的真实部署中得到验证。该平台旨在帮助各类机构以更高效率、更强协同能力以及更高决策信心,实现从数据洞察到实时决策的快速转化。 该平台整合了GEOINT (地理空间情报)OSINT(开源情报...

技术创新研究所与世界经济论坛在达沃斯宣布成立“阿布扎比前沿技术中心”

瑞士达沃斯--(BUSINESS WIRE)--(美国商业资讯)-- 技术创新研究所(TII)是阿布扎比先进技术研究委员会(ATRC)下属的应用技术研究部门,与世界经济论坛(WEF)宣布成立阿布扎比前沿技术中心,为世界经济论坛著名的第四次工业革命研究中心(C4IR)全球网络增加新成员。 本次合作在2026年达沃斯世界经济论坛年会的辅助活动签约仪式上正式确定,标志着在深化国际合作,塑造前沿技术的未来方面迈出十分重要的一步。 该中心的宗旨明确为引领前沿技术研究与开发的突破,推动全球新兴技术政策的进步,促进将创新从实验室走向实际部署的国际合作,将进一步提高阿联酋作为真实世界创新试验场的地位。阿联酋拥有敏捷的监管环境以及良好的研究、政策和执行联系,为在全国范围内试验、部署和扩展新兴技术提供了独特的平台,而通过世界经济论坛的全球C4IR网络,现在这一优势将得到进一步放大。 这一新中心将树立阿布扎比作为全球先进技术探索研究的中心地位,专注于量子计算、机器人、推进和空间系统以及相关的人工智能应用。通过本次战略合作,TII将加入一个全球联网的创新生态系统,旨在加速颠覆性技术的负责任采用。 TII首席执...

阿布扎比TII推出Falcon-H1 Arabic,树立全球阿拉伯语AI模型新标杆

阿拉伯联合酋长国阿布扎比--(BUSINESS WIRE)--(美国商业资讯)-- Technology Innovation Institute(TII)——阿布扎比先进技术研究委员会(Advanced Technology Research Council,ATRC)旗下的应用研究机构——正式发布Falcon-H1 Arabic。这是一款基于混合式Mamba-Transformer架构全新打造的大型语言模型,标志着对以往Transformer架构路线的根本性突破。凭借卓越的综合性能,Falcon-H1 Arabic已在Open Arabic LLM Leaderboard(OALL)上确立其作为当前全球表现最优阿拉伯语AI模型的领先地位。 这一里程碑式的进展使Falcon-H1 Arabic确立为目前市场上表现最为领先的阿拉伯语人工智能模型。该模型在参数规模显著更小的情况下,依然全面超越多款体量数倍于己的同类模型,在准确率、上下文理解能力及语言表征等核心维度上均达到业界最先进水平。 阿联酋总统顾问、先进技术研究委员会(ATRC)秘书长Faisal al Bannai阁下表示:“Fa...
Back to Newsroom