-

阿聯技術創新研究所利用新架構革新人工智慧語言模型

  • 經Hugging Face獨立驗證,Falcon Mamba 7B是全球效能第一的開放原始碼狀態空間語言模型(SSLM)
  • SSLM的記憶體成本低,無需額外記憶體即可生成任意長文字區塊
  • Falcon Mamba 7B還優於傳統的Transformer架構模型,如Meta的 Llama 3.1 8B和Mistral的7B
  • 新模型體現了阿布達比在人工智慧研發領域的創新和開拓精神

阿聯阿布達比--(BUSINESS WIRE)--(美國商業資訊)-- 技術創新研究所(TII)是全球首屈一指的科研中心和阿布達比先進技術研究理事會(ATRC)的應用研究支柱。該研究所發布了Falcon系列中的一款新的大型語言機型——Falcon Mamba 7B。經Hugging Face獨立驗證,新模型是全球效能第一的開放原始碼狀態空間語言模型(SSLM)。

身為Falcon系列的首款SSLM,它有別於之前所有使用Transformer架構的Falcon模型。新的Falcon Mamba 7B模型是該研究所正在進行的開創性研究及其以開放原始碼形式向社群提供突破性工具和產品的又一例證。

ATRC秘書長兼阿聯總統策略研究和先進技術事務顧問Faisal Al Bannai閣下表示:「Falcon Mamba 7B代表TII連續第四次獲得人工智慧模型排名第一,鞏固了阿布達比作為全球人工智慧研發中心的地位。這一成就彰顯了阿聯對創新的堅定承諾。」

在Transformer架構模型方面,Falcon Mamba 7B在HuggingFace新引進的基準測試中優於Meta的Llama 3.1 8B、Llama 3 8B和Mistral的7B。同時,在其他SSLM中,Falcon Mamba 7B在舊基準測試中擊敗了所有其他開放原始碼模型,它將成為HuggingFace新的更嚴苛基準測試排行榜上的第一款模型。

TII執行長Najwa Aaraj博士表示:「技術創新研究所繼續透過Falcon系列人工智慧模型突破技術發展的界限。Falcon Mamba 7B代表了真正的開創性工作,為未來的人工智慧創新奠定了基礎,這些創新將強化人類的能力並改善生活。」

狀態空間模型在理解隨時間演變的複雜情況(如一整本書的內容)方面表現極為出色。這是因為SSLM不需要額外的記憶體來消化如此大量的資訊。

另一方面,基於Transformer的模型在記住和使用它們之前處理過的序列資訊方面非常高效。這使它們在內容生成等任務中表現出色,然而,由於它們會將每個單字與其他單字進行比較,這就需要大量的運算能力。

SSLM可應用於各種領域,如估計、預測和控制任務。與Transformer架構模型類似,它們在自然語言處理任務中也有出色表現,可應用于機器翻譯、文本摘要、電腦視覺和音訊處理。

TII人工智慧跨中心部門代理首席研究員Hakim Hacid博士表示:「在推出Falcon Mamba 7B之際,我為TII促進其發展的合作生態系統感到驕傲。這次發布代表我們向前邁出了一大步,啟發了新的視角,進一步推動了對智慧系統的探索。在TII,我們正在突破SSLM和Transformer模型的界限,以激發生成式人工智慧領域的更多創新。」

Falcon LLM的下載次數已超過4500萬次,證明了該模型的巨大成功。Falcon Mamba 7B將基於TII Falcon License 2.0發布。這是一種基於Apache 2.0的寬鬆軟體許可證,包含一項促進人工智慧負責任使用的可接受使用政策。如欲瞭解有關這一新模型的更多資訊,請造訪FalconLLM.TII.ae。

*來源: AETOSWire

免責聲明:本公告之原文版本乃官方授權版本。譯文僅供方便瞭解之用,煩請參照原文,原文版本乃唯一具法律效力之版本。

Contacts

Jennifer Dewan,資深傳播總監
Jennifer.dewan@tii.ae

The Technology Innovation Institute



Contacts

Jennifer Dewan,資深傳播總監
Jennifer.dewan@tii.ae

More News From The Technology Innovation Institute

阿布達比科技創新研究院 (TII) 和NVIDIA共同成立中東第一座專門從事人工智慧與機器人研究的NVAITC聯合實驗室

阿拉伯聯合大公國,阿布達比--(BUSINESS WIRE)--(美國商業資訊)-- 隸屬阿布達比高級科技研究委員會 (ATRC) 的應用研究機構「科技創新研究院」 (The Technology Innovation Institute, TII) 與高速運算及人工智慧科技的世界先驅NVIDIA聯手合作,成立中東第一座專門從事人工智慧與機器人研究的聯合實驗室。這項破天荒的合作計畫將在該地成立第一座開發下一代人工智慧模型、機器人平台和人形機器人技術的研究中心,加速整個產業的創新。 成立科技創新研究院-NVAITC(NVIDIA人工智慧技術中心)人工智慧與機器人聯合實驗室的消息在於科技創新研究院阿布達比總部進行的簽約儀式上宣布,兩大機構的多位資深主管列席這場儀式。這份合約由科技創新研究院執行長Najwa Aaraj博士和NVIDIA的META地區企業區域總監Marc Domenech共同簽署,並有ATRC總幹事Shahab Abu Shahab殿下、ATRC支援服務執行董事Abdulaziz Al Dosari殿下、NVIDIA的HPC/超級運算銷售與業務開發全球副總裁John Jose...

科技創新研究院及AI71與Amazon Web Services合作,為阿拉伯聯合大公國及其他地區拓展人工智慧創新規模

阿拉伯聯合大公國,阿布達比--(BUSINESS WIRE)--(美國商業資訊)-- 阿布達比的科技創新研究院 (TII) 是全球名列前茅的Falcon系列人工智慧模型及安全和隱私解決方案之創造者。該院和阿布達比專擅客製企業級產品的一流人工智慧公司AI71決定與Amazon Web Services (AWS) 合作,擴大開放外界使用阿拉伯聯合大公國製造的人工智慧模型及解決方案。 AI71善於打造高階人工智慧代理,結合科技創新研究院在大型語言模型 (LLM) 方面的技術專長以及AWS獨步全球的雲端人工智慧及機器學習服務之後,全球專業人士將能夠輕鬆使用Falcon及客製人工智慧解決方案,變革群眾生活與工作的模式。 科技創新研究院已透過Amazon SageMaker提供多種Falcon大型語言模型,而最新的模型也將在Amazon Bedrock Marketplace上開放使用。Falcon系列內含多款全球排名長期位居前茅的模型,為各類人工智慧需求提供可擴展的解決方案。企業及開發者可將透過按需付費的API將Falcon整合到他們的應用程式中,降低對運算能力的大量需求。 AI71的產品專為...

中東領先的人工智慧巨擘TII推出兩款全新人工智慧模型:Falcon系列首款阿拉伯語模型Falcon Arabic,以及同類最佳高效能模型Falcon-H1

阿拉伯聯合大公國阿布達比--(BUSINESS WIRE)--(美國商業資訊)-- 阿布達比高級科技研究委員會 (ATRC) 下屬的技術創新研究所(TII)今天發布了兩項重大人工智慧進展:Falcon Arabic是Falcon系列首款阿拉伯語模型,現已成為該地區表現最佳的阿拉伯語人工智慧模型,而Falcon-H1則是一款透過全新架構設計重新定義了效能和可移植性的新模型。在中小型人工智慧模型(300億至700億個參數)中,Falcon-H1的效能超越了Meta的LlaMA和阿里巴巴的Qwen等競品,可在日常裝置和資源有限的環境中實現真實世界的人工智慧。阿聯總統顧問暨ATRC秘書長Faisal Al Bannai閣下在「Make it in the Emirates」活動上發表主題演講時宣布了這一消息。 Falcon Arabic建立在Falcon 3-7B(70億參數)之上,是迄今為止已開發的最先進的阿拉伯語人工智慧模型之一。該模型在涵蓋現代標準阿拉伯語和地區方言的高品質母語(非翻譯)阿拉伯語資料集上進行訓練,全面捕捉了阿拉伯世界的語言多樣性。根據開放式阿拉伯語LLM排行榜基準,Fal...
Back to Newsroom