-

技术创新研究所宣布推出全球规模居首的阿拉伯语自然语言处理模型NOOR

  • 该模型是迄今为止功能极其强大的阿拉伯语模型,拥有100亿个参数
  • 面向自动摘要、聊天机器人、个性化营销等应用

阿联酋阿布扎比--(BUSINESS WIRE)--(美国商业资讯)-- (美国商业资讯)--阿布扎比先进技术研究委员会旗下的全球研究中心和应用研究支柱部门技术创新研究所(TII)今天宣布推出NOOR语言处理模型,这是迄今为止全球规模居首的阿拉伯语自然语言处理(NLP)模型。

TII的高级研究人员和人工智能专家团队与LightOn联手,对这个阿拉伯语NLP模型进行了改进。LightOn是一家专为企业提供超大规模机器智能的技术公司。NOOR模型能够执行超出语言领域的任务,可提供覆盖整个端到端处理管道的高质量数据,包括大规模数据抓取、过滤和管理。该模型可促进超大规模数据的分布式训练和服务,基于该模型的应用具有高效推理能力,并可针对特定领域进行模型调整。

TII和ASPIRE首席执行官Ray O. Johnson博士表示:“这一进展将大幅提升我们的研究能力和资质,并提升阿布扎比和阿联酋作为重要研究生态系统的地位。我们的专家团队再次证明,阿布扎比和阿联酋地区可以取得具有世界影响力的、突破性的研发成果。”

TII人工智能跨学科中心部门主任Ebtesam Almazrouei博士表示:“在自然语言处理领域,大型语言模型不断涌现。能推出这个拥有100亿个参数的先进模型,我们感到很自豪。这是全球规模居首的阿拉伯语NLP模型。为训练该模型,我们采集了一套独一无二的大型阿拉伯语数据集。相关工作历经数月时间,包括对各种来源数据的整理、剔除和过滤。在此特别感谢参与该项目的整个团队,他们使NOOR成为世界各地学者和企业首选的阿拉伯语研究模型。”

TII数字科学研究中心和人工智能跨学科中心部门首席研究员Mérouane Debbah教授在发布会上表示:“通过NOOR,TII利用在大型语言模型方面的专有技术,扩大了现代标准阿拉伯语模型的范围,以在新一代人工智能研究中建立跨学科的先进专长。”

NOOR拥有超过300亿字的独特数据集,涵盖网络数据、书籍、诗歌、新闻文章和技术信息等来源,从而打造出全球规模居首的高质量跨领域阿拉伯语数据集,并大幅拓宽了该模型的适用范围。

Ebtesam Almazrouei博士表示,NOOR模型基于流行的Transformer架构,仅包含解码器,结构与GPT-3相似,其设计旨在处理生成类任务。经过升级的架构引入了机器学习领域的最新发展,包括更好的位置嵌入等改进。为确保NOOR大规模数据集的质量,TII团队设计了一个基于机器学习技术的自动过滤管道。相关工具可以识别优质参考文本,并保障模型不受垃圾内容污染。

NOOR利用先进的3D并行技术,在配备128个A100 GPU的高性能计算资源上进行了训练,该过程采用分布式计算模式,能够确保有效利用可用的硬件资源。

人工智能跨学科中心部门主任指出,NOOR只是该部门努力为更广泛的阿联酋人工智能战略做出贡献的第一步。

该模型以阿拉伯语中的“光”命名,以体现模型旨在启迪人类智慧的宗旨。

关于技术创新研究所(TII):

如需了解更多信息,请访问www.tii.ae

*来源:AETOSWire

免责声明:本公告之原文版本乃官方授权版本。译文仅供方便了解之用,烦请参照原文,原文版本乃唯一具法律效力之版本。

Contacts

技术创新研究所
Sneha Sivanand, sneha.sivanand@tii.ae

Technology Innovation Institute



Contacts

技术创新研究所
Sneha Sivanand, sneha.sivanand@tii.ae

More News From Technology Innovation Institute

阿布扎比TII与NVIDIA启动中东首个“人工智能与机器人”NVAITC联合研究实验室

阿布扎比,阿拉伯联合酋长国--(BUSINESS WIRE)--(美国商业资讯)-- 阿布扎比先进技术研究委员会(ATRC)的应用研究机构——技术创新研究院(TII),与全球加速计算和人工智能领导者NVIDIA强强联手,共同创立中东首个专注于人工智能与机器人技术的联合实验室。这一里程碑式的合作将在该地区打造前所未有的创新中心,致力于开发下一代人工智能模型、机器人平台及人形机器人技术,加速各行各业的创新。 TII-NVAITC(NVIDIA人工智能技术中心)人工智能与机器人联合实验室签约仪式在TII阿布扎比总部举行,双方高层代表共同见证这一重要时刻。TII首席执行官Najwa Aaraj博士与NVIDIA中东、土耳其和非洲地区企业业务区域总监Marc Domenech签署合作协议,ATRC总干事Shahab Abu Shahab阁下、ATRC支持服务执行董事Abdulaziz Al Dosari阁下、NVIDIA HPC/超级计算销售与业务发展全球副总裁John Josephakis、NVIDIA全球人工智能技术中心主管Simon See等嘉宾共同出席,本次合作标志着阿联酋人工智能与机器...

Technology Innovation Institute 与 AI71 携手 Amazon Web Services,共同推动阿联酋及全球 AI 创新发展

阿布扎比,阿联酋--(BUSINESS WIRE)--(美国商业资讯)-- 阿布扎比 Technology Innovation Institute(TII)是全球领先的 Falcon 系列人工智能模型及安全隐私解决方案的创造者,AI71 是阿布扎比领先的人工智能公司,专注于提供定制化企业 AI 产品。两家机构正与 Amazon Web Services(AWS)合作,扩大对阿联酋制造的人工智能模型和解决方案的访问。 通过整合 TII 在大语言模型(LLM)领域的技术专长、AI71 在 AI 智能助手构建方面的深厚经验,以及 AWS 全球领先的云端人工智能与机器学习服务,全球专业用户将能便捷获取 Falcon 系列及高度定制的 AI 解决方案,改变人们的生活与工作方式。 目前,TII 已通过 Amazon SageMaker 提供多个 Falcon 大语言模型,最新的模型也即将在 Amazon Bedrock Marketplace 上架。Falcon 系列覆盖多种规格的大模型,在全球大模型排行榜中名列前茅,能为各类 AI 需求提供可扩展的解决方案。企业与开发者可通过即用即付 API...

中东领先的人工智能巨头TII推出两款全新人工智能模型:Falcon系列首款阿拉伯语模型Falcon Arabic,以及同类最佳高性能模型Falcon-H1

阿拉伯联合酋长国阿布扎比--(BUSINESS WIRE)--(美国商业资讯)-- 阿布扎比先进技术研究协会(ARTC)下属的科技创新研究所(TII)今天发布了两项重大人工智能进展:Falcon Arabic是Falcon系列首款阿拉伯语模型,现已成为该地区表现最佳的阿拉伯语人工智能模型,而Falcon-H1则是一款通过全新架构设计重新定义了性能和可移植性的新模型。在中小型人工智能模型(300亿至700亿个参数)中,Falcon-H1的性能超越了Meta的LlaMA和阿里巴巴的Qwen等竞品,可在日常设备和资源有限的环境中实现真实世界的人工智能。阿联酋总统顾问兼ATRC秘书长Faisal Al Bannai阁下在“Make it in the Emirates”活动上发表主题演讲时宣布了这一消息。 Falcon Arabic建立在Falcon 3-7B(70亿参数)之上,是迄今为止已开发的最先进的阿拉伯语人工智能模型之一。该模型在涵盖现代标准阿拉伯语和地区方言的高质量母语(非翻译)阿拉伯语数据集上进行训练,全面捕捉了阿拉伯世界的语言多样性。根据开放式阿拉伯语LLM排行榜基准,Falco...
Back to Newsroom