Abu Dhabi, Verenigde Arabische Emiraten--(BUSINESS WIRE)--Technology Innovation Institute (TII), de toegepaste onderzoeksafdeling van de Advanced Technology Research Council (ATRC) van Abu Dhabi, heeft Falcon-H1 Arabic aangekondigd: een nieuw ontwikkeld groot taalmodel dat is gebouwd op een hybride Mamba-Transformer-architectuur. Dit nieuwe model vertegenwoordigt een volledige afwijking van eerdere op transformers gebaseerde versies en vestigt zich als het best presterende systeem op de Open Arabic LLM Leaderboard (OALL).

Deze mijlpaal positioneert Falcon-H1 Arabic als het toonaangevende Arabische AI-model dat momenteel beschikbaar is, en presteert beter dan modellen die vele malen groter zijn, terwijl het toonaangevende nauwkeurigheid, contextbegrip en taalkundige representatie levert.

Zijne Excellentie Faisal al Bannai, adviseur van de president van de VAE en secretaris-generaal van de Advanced Technology Research Council, verklaarde: “Falcon-H1 Arabic weerspiegelt onze voortdurende inzet om de positie van de Verenigde Arabische Emiraten als internationaal centrum voor geavanceerde technologie en verantwoorde AI te versterken. Door modellen te leveren die de taalkundige en culturele behoeften van de regio ondersteunen, maken we innovatie mogelijk die toegankelijk, relevant en impactvol is in onze samenlevingen. Deze prestatie getuigt van de diepgang aan talent en onderzoeksexpertise binnen het Technology Innovation Institute.”

Voortbouwend op de sterke ontvangst van de eerder dit jaar gelanceerde Falcon-Arabic-modellen, die de duidelijke behoefte binnen de gemeenschap aan hoogwaardige Arabische LLM’s benadrukten, heeft het Technology Innovation Institute zijn werkzaamheden voortgezet met de nieuwe Falcon-H1 Arabic-familie. De modellen zijn verkrijgbaar in de parametergroottes 3B, 7B en 34B en zijn ontworpen om te voldoen aan verschillende infrastructuur- en use-case-behoeften. Falcon-H1 Arabic introduceert verbeteringen in datakwaliteit, dekking van dialecten, stabiliteit bij lange contexten en wiskundig redeneren, waardoor een nauwkeuriger, betrouwbaarder en contextbewuster begrip van het Arabisch mogelijk wordt in uiteenlopende praktische toepassingen.

Dr. Najwa Aaraj, CEO van TII, zei: "De ontwikkeling van Falcon-H1 Arabisch bouwt voort op jaren van fundamenteel werk in Arabische AI en reageert rechtstreeks op de behoeften van onze gemeenschappen, inclusief ontwikkelaars en bedrijven. Door de architectuur, datakwaliteit en redenering in lange contexten te verbeteren, creëren we mogelijkheden die nieuwe kansen bieden in onderwijs, gezondheidszorg, bestuur, ondernemen en meer, allemaal in het Arabisch. Dit model vertegenwoordigt een belangrijke stap in onze missie om AI van wereldklasse te leveren die de regio dient en bijdraagt aan wereldwijde vooruitgang.”

Benchmarkresultaten

Op het OALL-scorebord, dat modellen evalueert op een breed scala aan Arabische begrips- en redeneertaken, toont Falcon-H1 Arabic duidelijk leiderschap op het gebied van prestaties:

Het 3B-model scoort gemiddeld 61,87%, 10 punten voor op toonaangevende 4B-concurrenten, zoals Microsoft's Phi-4 Mini.

Het 7B-model scoort gemiddeld 71,47%, wat alle ~10B-modellen overtreft, waaronder het Fanar-1-9B-model van Qatar en het HUMAIN ALLaM 7B-model van Saoedi-Arabië.

Het 34B-model scoort 75,36% en presteert zelfs beter dan 70B+ parametersystemen, waaronder Qwen2.5 72B van China en Llama-3.3 70B van META.

Naast OALL behalen de Falcon-H1 Arabic-modellen ook uitstekende resultaten op meer gerichte benchmarks, waaronder (i) 3LM, voor STEM-redenering, (ii) ArabCulture, voor cultureel en contextueel begrip, en (iii) AraDice (dialectbegrip).

Samen vormen deze resultaten een doorbraak voor Arabische AI. Falcon-H1 Arabic presteert niet alleen beter dan modellen die vele malen groter zijn, zowel op algemene als gespecialiseerde benchmarks, maar laat ook een niveau van taalkundige diepgang, redeneervermogen en efficiëntie zien dat een nieuwe maatstaf voor het vakgebied zet. Dit maakt Falcon-H1 Arabic tot het meest capabele en veelzijdige Arabische taalmodel dat tot nu toe is ontwikkeld.

Dr. Hakim Hacid, hoofdonderzoeker bij het Artificial Intelligence and Digital Research Centre (AIDRC) van het Technology Innovation Institute, verklaarde: “Dit model weerspiegelt onze focus op het ontwikkelen van Arabische AI die niet alleen geavanceerder is, maar ook daadwerkelijk bruikbaar in praktijksituaties. Door de efficiëntie, de diepgang van het begrip en de taaldekking te verbeteren, maken wij AI-systemen mogelijk die instellingen, ontwikkelaars en gemeenschappen in de hele regio beter kunnen ondersteunen.”

Het model vergroot ook de contextlengte aanzienlijk, met contextvensters tot wel 256K tokens, waardoor de modellen in staat zijn om binnen één enkele interactie met grote hoeveelheden informatie te werken. In de praktijk betekent dit dat gebruikers bijvoorbeeld omvangrijke juridische documenten, medische dossiers, academische artikelen of bedrijfskennisbanken kunnen analyseren zonder context of samenhang te verliezen - een mogelijkheid die op deze schaal voorheen niet bestond.

De Falcon-AI-modellen van TII staan sinds 2023 op de eerste plaats in zowel regionale als mondiale benchmarks, waarbij Falcon-H1 Arabic nu het Open Arabic LLM Leaderboard aanvoert over alle modelgroottes heen. Deze resultaten tonen aan dat TII in staat is soevereine AI-capaciteiten te ontwikkelen die op het hoogste mondiale niveau kunnen concurreren, terwijl zij het leiderschap van Abu Dhabi en de bredere Verenigde Arabische Emiraten op het gebied van Arabisch AI-onderzoek en innovatie verder versterken.

De nieuwe modellen zijn nu toegankelijk via de playground via de publieke interface van TII op: https://chat.falconllm.tii.ae.