-

Dataocean AI nam deel aan het creëren van de open-source dataset GigaSpeech 2: een grootschalige, multi-domein ASR-corpus voor low-resource talen

IRVINE, Calif.--(BUSINESS WIRE)--Dataocean AI heeft samengewerkt met Shanghai Jiao Tong University, de Chinese Universiteit van Hongkong, Tsinghua University, Pengcheng Lab, AISpeech, Birch AI en Seasalt AI aan de succesvolle ontwikkeling van GigaSpeech 2. De ontwikkeling en testsets van GigaSpeech 2 zijn gelabeld door een professioneel team van Dataocean AI.

Overzicht van GigaSpeech 2

GigaSpeech 2 is een steeds groter wordende, grootschalige multi-domein en meertalige spraakherkenningscorpus ontworpen om onderzoek en ontwikkeling op gebied van spraakherkenning van low-resource talen te promoten. GigaSpeech 2 omvat grofweg 30.000 uren automatische transcriptie van audio, die het Thai, het Indonesisch en het Vietnamees dekt.

Deze bekendmaking is officieel geldend in de originele brontaal. Vertalingen zijn slechts als leeshulp bedoeld en moeten worden vergeleken met de tekst in de brontaal, die als enige rechtsgeldig is.

More News From Dataocean AI

Samenvatting: Dataocean AI lanceert kwaliteitsvolle, gebruiksklare datasets en grensoverschrijdende dataoplossingen tijdens Interspeech 2024

ATHENE, Griekenland--(BUSINESS WIRE)--In de snel groeiende AI-markt, die zich vooral toespitst op funderingsmodellen en Generatieve AI, heeft de kwaliteit van datasets een rechtstreekse impact op de prestaties. In applicaties die in de praktijk worden gebruikt, zijn data rommelig en het verbeteren van modellen is niet de enige manier om betere prestaties te verkrijgen. Nu industrieën door AI steeds verder worden getransformeerd, is de behoefte aan kwaliteitsvolle datasets van dooslaggevend bela...

Samenvatting: Dataocean AI onthult NIEUW merk, NIEUWE site en NIEUWE Multilingual Speech Corpus voor Speech Foundation Models tijdens ICASSP 2024

SEOEL, Zuid-Korea--(BUSINESS WIRE)--Dataocean AI, een internationale provider van dataservices, kondigde tevreden een NIEUW merk, een NIEUWE site en een NIEUWE Multilingual Speech Corpus voor Speech Foundation Models aan tijdens de ICASSP 2024. Dataocean AI kondigde de upgrade van haar merkprofilering aan tijdens ICASSP. Het nieuwe merk, dat zich onderscheidt door een dynamisch gradiënt design, symboliseert de niet-aflatende inzet van het bedrijf voor uitmuntendheid en innovatie in de sector va...
Back to Newsroom