-

Dataocean AI ha partecipato alla creazione del set di dati open source GigaSpeech 2, un corpus ASR multidominio su grande scala per lingue con ridotte risorse

IRVINE, California--(BUSINESS WIRE)--Dataocean AI ha collaborato con l’Università Jiao Tong di Shanghai, l’Università cinese di Hong Kong, l’Università di Tsinghua, il laboratorio di Pengcheng, AISpeech, Birch AI e Seasalt AI per sviluppare GigaSpeech 2, un’iniziativa coronata dal successo. I set di sviluppo e test di GigaSpeech 2 vengono etichettati da un’équipe di professionisti Dataocean AI.

Panoramica su GigaSpeech 2

GigaSpeech 2 è un corpus di riconoscimento del discorso multilingue e multidominio, su grande scala, in continua espansione, progettato per promuovere la ricerca e lo sviluppo nel riconoscimento del discorso in lingue a ridotte risorse. La versione grezza di GigaSpeech 2 contiene 30.000 ore di audio trascritto automaticamente per le lingue della Thailandia, dell’Indonesia e del Vietnam.

Il testo originale del presente annuncio, redatto nella lingua di partenza, è la versione ufficiale che fa fede. Le traduzioni sono offerte unicamente per comodità del lettore e devono rinviare al testo in lingua originale, che è l'unico giuridicamente valido.

More News From Dataocean AI

Riassunto: Dataocean AI ha lancia un set di dati off-the-shelf di alta qualità e database di frontiera a Interspeech 2024

ATENE, Grecia--(BUSINESS WIRE)--Nel mercato dell'IA in rapida evoluzione, che ruota soprattutto attorno ai modelli di base e all'IA generativa, la qualità dei set di dati ha un impatto diretto sulle prestazioni. Nelle applicazioni reali, i dati sono disordinati e migliorare i modelli non è l'unico modo per ottenere prestazioni migliori. Poiché l'IA continua a trasformare i settori industriali, la necessità di set di dati di alta qualità è diventata fondamentale per sviluppare sistemi reattivi,...

Riassunto: Dataocean AI presenta un NUOVO brand, un NUOVO sito e un NUOVO corpus di parlato multilingue per i modelli di fondazione del linguaggio a ICASSP 2024

SEUL, Corea del Sud--(BUSINESS WIRE)--Dataocean AI, un fornitore globale di servizi di dati, è lieto di annunciare la presentazione di un NUOVO brand, di un NUOVO sito e di un nuovo corpus multilingue di parlato per i modelli di fondazione del linguaggio a ICASSP 2024. Dataocean AI ha annunciato l'aggiornamento del proprio branding in occasione di ICASSP. Il nuovo brand, caratterizzato da un design dinamico a gradienti, simboleggia l'impegno costante dell'azienda verso l'eccellenza e l'innovazi...
Back to Newsroom