ABU DHABI, Emiratos Árabes Unidos--(BUSINESS WIRE)--El Instituto de Innovación Tecnológica (TII), la división de investigación aplicada del Consejo de Investigación Tecnológica Avanzada (ATRC) de Abu Dhabi, ha presentado Falcon-H1 Arabic, un modelo lingüístico grande que han desarrollado recientemente a partir de una arquitectura híbrida Mamba-Transformer. Este nuevo modelo, que supone un cambio radical con respecto a las versiones anteriores que usaban transformadores, se consolida como el sistema de mayor rendimiento en la lista Open Arabic LLM Leaderboard (OALL).

Se trata de un logro que convierte a Falcon-H1 Arabic en el modelo de IA árabe líder actual, porque supera a otros modelos varias veces más grandes al ofrecer una precisión, un manejo del contexto y una representación lingüística de última generación.

Al respecto, Su Excelencia Faisal al Bannai, asesor del presidente de los Emiratos Árabes Unidos y secretario general del Consejo de Investigación Tecnológica Avanzada (ATRC), señaló: "Falcon-H1 Arabic es una muestra de nuestro compromiso permanente con el fortalecimiento de la posición de los Emiratos Árabes Unidos como centro mundial de tecnología avanzada e inteligencia artificial responsable. Nosotros ofrecemos modelos que satisfacen las necesidades lingüísticas y culturales de la región y por eso, facilitamos la innovación accesible, relevante e impactante en todas nuestras sociedades. Este logro es una prueba de la profundidad del talento y la experiencia en investigación del TII".

Dada la excelente recepción que han tenido los modelos Falcon-Arabic implementados a principios de este año, que pusieron de manifiesto la clara necesidad de la comunidad de contar con LLM árabes de alta calidad, el TII ha progresado en su labor con la nueva familia Falcon-H1 Arabic. Estos modelos están diseñados para satisfacer diversas necesidades de infraestructura y aplicaciones y están disponibles en tamaños de parámetros de 3B, 7B y 34B. Falcon-H1 Arabic introduce mejoras en la calidad de los datos, la cobertura de dialectos, la estabilidad en contextos largos y el razonamiento matemático, de modo que la comprensión del árabe es más precisa, confiable y contextualizada en las aplicaciones del mundo real.

Por su parte, la Dra. Najwa Aaraj, directora general de TII, comentó: "El desarrollo de Falcon-H1 Arabic es el resultado de una labor fundamental de años en IA árabe y responde directamente a las necesidades de nuestras comunidades, en particular, los desarrolladores y las empresas. Al mejorar la arquitectura, la calidad de los datos y el razonamiento en contextos largos, hemos creado herramientas que abren nuevas posibilidades en educación, atención médica, gobierno corporativo y el sector empresarial, entre otros ámbitos, y todo en árabe. Este modelo representa un paso importante en nuestra misión de brindar una IA de primera clase que le sirva a la región y contribuya al progreso global".

Resultados comparativos

En la clasificación OALL, que evalúa los modelos en una amplia gama de tareas de comprensión y razonamiento del árabe, Falcon-H1 Arabic demuestra un claro liderazgo en su rendimiento:

El modelo 3B tiene una puntuación promedio del 61,87 %, 10 puntos por delante de los principales competidores 4B, como Phi-4 Mini de Microsoft.

El modelo 7B tiene una puntuación promedio del 71,47 %, que supera la de todos los modelos ~10B, incluidos Fanar-1-9B de Qatar y HUMAIN ALLaM 7B de Arabia Saudita.

El modelo 34B tiene una puntuación del 75,36 % y supera así incluso a los sistemas de más de 70B parámetros, entre ellos, el Qwen2.5 72B de China y el Llama-3.3 70B de META.

Además de OALL, los modelos Falcon-H1 Arabic también han logrado resultados sobresalientes en pruebas de referencia más específicas, como (i) 3LM, para el razonamiento STEM, (ii) ArabCulture, para la comprensión cultural y contextual y (iii) AraDice (comprensión del dialecto).

Conjuntamente, estos resultados representan un enorme avance para la IA árabe. Falcon-H1 Arabic no solamente ha superado modelos varias veces más grandes, tanto en las pruebas generales como en las especializadas, sino que también demuestra un nivel de profundidad lingüística, capacidad de razonamiento y eficiencia que sienta un nuevo parámetro de referencia en el campo. Esto consolida a Falcon-H1 Arabic como el modelo de lengua árabe más capaz y versátil que se haya desarrollado hasta la fecha.

El Dr. Hakim Hacid, investigador jefe del Centro de Investigación Digital e Inteligencia Artificial (AIDRC) del TII, subrayó al respecto: "Este modelo demuestra que apuntamos a crear una IA árabe que no solo sea más avanzada, sino que también sea realmente útil en los entornos reales. Al mejorar la eficiencia, la profundidad de comprensión y la cobertura lingüística, creamos sistemas de IA que pueden asistir mejor a las instituciones, los desarrolladores y las comunidades de toda la región".

Asimismo, este modelo amplía drásticamente la longitud del contexto, con ventanas de hasta 256 000 tokens, de modo que los modelos pueden trabajar con volúmenes enormes de información en una sola interacción. En la práctica, esto implica por ejemplo, que los usuarios pueden analizar documentos legales extensos, notas médicas, artículos académicos o bases de conocimientos empresariales sin perder el contexto ni la continuidad, una capacidad que antes no era factible a esta escala.

Los modelos Falcon AI de TII vienen ocupando el primer puesto en las clasificaciones regionales y mundiales desde 2023 y Falcon-H1 Arabic ya lidera la lista de Open Arabic LLM Leaderboard en todos los tamaños de modelo. Estos resultados demuestran que TII está en condiciones de desarrollar capacidades soberanas de IA que compiten al más alto nivel mundial, además de promover el liderazgo de Abu Dabi y de los Emiratos Árabes Unidos en general en la investigación y la innovación en materia de IA árabe.

Los nuevos modelos ya se pueden obtener en el entorno de pruebas a través de la interfaz pública de TII en: https://chat.falconllm.tii.ae.

Fuente: AETOSWire

El texto original en el idioma fuente de este comunicado es la versión oficial autorizada. Las traducciones solo se suministran como adaptación y deben cotejarse con el texto en el idioma fuente, que es la única versión del texto que tendrá un efecto legal.