-

Falcon 2:阿聯酋技術創新研究院發布新AI模型系列,性能優於Meta新Llama 3

  • 下一代Falcon 2系列推出開源、多語言、多模式的AI模型,並且是唯一具有視覺到語言能力的AI模型
  • Hugging Face 排行榜獨立驗證,新款 Falcon 2 11B 優於 Meta 的 Llama 3 8B,並與領先的 Google Gemma 7B 型號表現相當
  • 近期計劃包括探索「混合專家」以增強機器學習能力

阿布達比, 阿拉伯聯合大公國--(BUSINESS WIRE)--(美國商業資訊)-- 科技創新研究院( Technology Innovation Institute, 簡稱「TII」),作為全球頂尖的科學研究中心及阿布達比高級技術研究委員會(Advanced Technology Research Council, 簡稱 「ATRC」)的應用研究支柱,今日發布了其知名大型語言模型(LLM)Falcon 2的第二版本。在此系列中,推出了兩個開創性版本:一個是Falcon 2 11B,一個效率更高、更易使用的LLM,訓練於5.5萬億token並擁有110億參數;另一個是Falcon 2 11B VLM,以其視覺到語言模型(VLM)能力著稱,能夠將視覺輸入無縫轉化為文字輸出。雖然兩款模型均支持多語言,但值得一提的是,Falcon 2 11B VLM作為TII首款多模態模型,在當前頂尖市場中獨樹一幟,擁有圖像轉文本的能力,這代表了AI創新的一大突破。

經過與其類別中多個知名的預訓練AI模型的比較測試後,Falcon 2 11B在性能上超越了Meta新發布的具有80億參數(8B)的Llama 3,並與排名第一的Google Gemma 7B並駕齊驅(Falcon 2 11B: 64.28對比Gemma 7B: 64.29),這一結果已由位於美國的平台Hugging Face獨立驗證。Hugging Face是一個提供開放型LLM的客觀評估工具和全球排行榜的平台。更為重要的是,Falcon 2 11B與11B VLM均為開源,為全球開發者提供無限制的訪問機會。未來,計畫將擴展Falcon 2下一代模型,推出多種不同規模的模型。這些模型將通過如「混合專家」(MoE)等先進的機器學習功能進行進一步的增強,目的在於將它們的性能提升到更加精緻的水平。

TII至今發布的所有AI模型一直在全球名列前茅,被譽為最強大的開源大型語言模型(LLM)。新推出的、更為精巧多功能的Falcon 2 11B模型預計將使TII在快速變化的生成式AI世界中,得到更廣泛的市場採納。

Falcon 2 11B模型擁有多語言處理能力,能夠流暢地處理包括英語、法語、西班牙語、德語及葡萄牙語在內的多種語言任務,其多功能性和在不同場景下的效能因此得到了增強。而作為一款視覺到語言模型的Falcon 2 11B VLM,能識別並解讀周遭環境中的圖像與視覺資訊,提供了一系列在醫療保健、金融、電子商務、教育及法律等多個行業中的應用。這包括從文件管理、數字歸檔與上下文索引,到幫助視覺障礙人士等應用。更重要的是,這些模型能夠僅利用一個圖形處理單元(GPU)來高效運轉,使其具有高度的擴展性和便於部署,且容易整合到筆記本電腦等輕型基礎設施與其他裝置中。

阿聯酋總統戰略研究與先進技術事務顧問、ATRC秘書長H.E. Faisal Al Bannai表示:「隨著Falcon 2 11B的問世,我們為Falcon 2系列帶來了第一款模型。Falcon 2 11B不僅展示了出色的表現,同時我們也藉此再次確認了我們對開源運動的堅定承諾以及對Falcon基金會的支持。隨著其他各種規模的多模式模型即將進入市場,我們希望確保那些重視隱私的開發者與實體可以使用到一流的AI模型,以實現他們的AI之旅。 」

在談及這款模型時,TII人工智慧跨中心單位的執行董事兼代理首席研究員Dr. Hakim Hacid分享道:「隨著AI技術不斷進步,開發者逐漸意識到更小型、效率更高模型的種種優勢。除了減少對計算能力的需求和達到可持續性的目標外,這些模型還能提供卓越的靈活性,輕鬆地與邊緣AI基礎設施完美融合——這是正在興起的下一大趨勢。加之,Falcon 2的視覺到語言功能為AI的易用性開拓了新天地,將圖像轉文本的創新互動方式帶給使用者。」

Falcon 2 11B的多樣性也促使TII考慮投身於更多充滿激情的GenAI創新之中。其中將採納一種新型機器學習能力,被稱為「混合專家」。這種方法涵蓋了將擁有不同專長的小型網絡結合起來,確保最具專業知識的領域合作,提供高度精緻和定制化的回應——宛如擁有一個團隊的智慧助手,其中每位成員都精通於不同的知識領域,並在需要時聯合預測或做出決策。這種方法不僅提升了準確性,也加速了決策過程,為開創更加智慧、高效的AI系統鋪平了道路。

Falcon 2 11B 根據 TII Falcon License 2.0 獲得授權,這是基於 Apache 2.0 的寬鬆軟體許可證,其中包括促進負責任地使用人工智慧的可接受的使用政策。 有關新型號的更多信息,請造訪 FalconLLM.TII.ae

資料來源: AETOSWire

免責聲明:本公告之原文版本乃官方授權版本。譯文僅供方便瞭解之用,煩請參照原文,原文版本乃唯一具法律效力之版本。

Contacts

Jennifer Dewan , 傳播資深總監
Jennifer.dewan@tii.ae

The Technology Innovation Institute



Contacts

Jennifer Dewan , 傳播資深總監
Jennifer.dewan@tii.ae

More News From The Technology Innovation Institute

人工智能在阿布扎比全球最先進自主無人機賽事中獲勝

阿聯酋阿布扎比--(BUSINESS WIRE)--(美國商業資訊)-- 阿布扎比 Autonomous Racing League(A2RL),隸屬於 Advanced Technology Research Council (ATRC),與 Drone Champions League(DCL)合作,在阿聯酋阿布扎比國際會議中心(ADNEC)Marina 展廳成功舉辦中東首屆「A2RL x DCL 自主無人機錦標賽」。在自主飛行與空中機械人技術的重大突破中,MavLab 戰隊的 AI 無人機擊敗世界頂尖人類飛手,贏得「AI 對戰人類挑戰賽」。這場終極對決創下史上最高難度紀錄,參賽者包括 DCL 獵鷹杯決賽選手——全球最強無人機飛手之一。 在為期兩天的高強度賽事中,14支國際團隊進入決賽週,前四名隊伍將在多種具有挑戰性的賽制中展開角逐。來自阿聯酋、荷蘭、奧地利、韓國、捷克、墨西哥、土耳其、中國、西班牙、加拿大和美國的團隊代表了大學實驗室、研究機構和創新創業者的多樣化背景。 所有隊伍使用標準化無人機,配備輕巧而強大的 NVIDIA Jetson Orin NX 運算模組、前置鏡頭及慣性...

阿拉伯聯合大公國著手繪製空中計程車和貨運無人機空中走廊地圖,為都會運輸轉型邁出一步

阿拉伯聯合大公國,杜拜--(BUSINESS WIRE)--(美國商業資訊)-- 阿拉伯聯合大公國決定跨出大膽的一步,重新定義都會運輸的可能性。第一步是繪製空中走廊,並建立真人駕駛和自動駕駛空中計程車和貨運無人機的監管架構。這項變革性的行動將使該國領導未來運輸的使命做出跳躍式的進展。透過與民航局 (GCAA) 和先進技術研究委員會 (ATRC) 旗下實體——科技創新研究院 (TII) 與ASPIRE——的戰略性合作,阿聯正在重塑人和貨物穿越都會空間的方式。 阿聯計畫在接下來20個月內規劃出空中走廊和監管方式。這項開創性的工作展現了該國佈署安全、先進、永續運輸解決方案的不懈承諾。這套解決方案不僅可以紓解交通壅塞,還能夠為未來都會運輸系統訂立全球標準。這些路線將連結阿聯境內重要國際機場和代表性地點, 進一步確保真人駕駛和自動駕駛空中計程車以及貨運無人機在全國城市中無縫整合。 民航局總幹事Saif Mohammed Al Suwaidi閣下說:「為真人駕駛和自動駕駛空中計程車以及無人機繪製空中走廊有如里程碑式的一步,可將先進空中交通無縫嵌入阿聯的基礎設施。這項行動可確保採行空中交通的安全與效...

Falcon 3:阿聯酋的科技創新研究院 (UAE’s Technology Innovation Institute) 推出世界上最強大的小型人工智慧模型,該模型也可以在包括筆記型電腦在內的輕型基礎設施上運行

阿布達比, 阿拉伯聯合大公國--(BUSINESS WIRE)--(美國商業資訊)-- 技术创新研究所 (TII),隸屬於阿布達比高級科技研究委員會 (ATRC) 的全球領先應用研究中心,正式推出了Falcon 3,其開源大型語言模型 (LLM) 系列的最新版本。這項突破性的發佈為小型LLM設立了全新的表現標準,並通過使該模型能夠高效運行於包括筆記型電腦在內的輕型基礎設施上,實現了先進人工智慧的普及化。Falcon 3引入了更卓越的推理能力和增強的微調功能,使其成為一款更強大且更實用的AI模型。 Falcon 3旨在實現高效能人工智慧的普及化,提供既強大又高效的模型。該模型基於 14兆代幣進行訓練,這一數字是其前代模型5.5兆的兩倍多。Falcon 3在多項基準測試中表現出卓越的性能,尤其是在全球範圍內名列前茅,能夠在單一GPU上運行。在推出後,Falcon 3登上了Hugging Face全球第三方LLM排行榜的榜首,超越了其他同等規模的開源模型,包括Meta的Llama系列。特別是Falcon 3-10B模型在其類別中領先,表現超越了所有參數少於130億的模型。 ATRC秘書長兼阿...
Back to Newsroom