Visual Bank breidt "Qlean Dataset" uit ter ondersteuning van grootschalige Japanse spraakbasismodellen
Visual Bank breidt "Qlean Dataset" uit ter ondersteuning van grootschalige Japanse spraakbasismodellen
Meer dan 100.000 uur aan rechtenvrije Japanse audio, inclusief regionale dialecten en cultureel contextgebonden spraak die essentieel is voor de ontwikkeling van commerciële AI.
TOKIO--(BUSINESS WIRE)--Visual Bank Group breidt Qlean Dataset uit door gebruik te maken van ruim 40 jaar expertise van amanaimages inc. De uitbreiding biedt hoogwaardige, juridisch getoetste Japanse taalcorpora, inclusief meer dan 100.000 uur aan audio voor commercieel gebruik.
Het bedrijf heeft zich gepositioneerd als toonaangevende leverancier voor Japanstalige data-infrastructuur dankzij een nieuwe ontwikkeling binnen de Qlean Dataset-divisie. Het zal datasets leveren aan instellingen die zich bezighouden met onderzoek en ontwikkeling, waarbij de rechten zijn vrijgegeven voor AI-training en grootschalige datatoepassingen. De datasets bestaan vooral uit gestructureerde corpora van Japanse spraak, geordend op basis van sprekersconfiguratie en thematisch domein.
Belangrijkste kenmerken voor AI-ontwikkelaars
-
Rechtengeklaarde gegevens voor commercieel gebruik
Alle datasets zijn volledig rechtengeklaard voor commercieel gebruik en voldoen aan wereldwijde nalevingsnormen zoals AVG (GDPR) en CCPA. -
High-fidelity audio-assets
Opnamen op 48kHz/16bit of hoger leggen zowel spraak van studiokwaliteit als akoestische omgevingen vast. -
Deskundige menselijke annotatie
Transcripten op moedertaalniveau en gestructureerde metadata bieden datasets die klaar zijn voor training voor AI-ontwikkeling. -
Datasets voor veiligheid en moderatie
Datasets ondersteunen de detectie van schadelijk taalgebruik, inclusief haatzaaiende uitlatingen en misbruikende aanwijzingen (prompts). -
Japanse evaluatiedatasets
Evaluatiedatasets zijn afgestemd op internationale benchmarks zoals MMSU om redenering en taalkundige nuances in het Japans te meten. -
Japan-specifieke akoestische omgevingen
Japan-specifieke audio, inclusief traditionele instrumenten, heiligdommen en stedelijke omgevingen, ondersteunt multimodale en ruimtelijke AI.
AI Data Recipe
https://qleandataset.visual-bank.co.jp/en/lineup
Japanse taalcorpora
https://qleandataset.visual-bank.co.jp/en/products/japanese-language-corpora
Deze bekendmaking is officieel geldend in de originele brontaal. Vertalingen zijn slechts als leeshulp bedoeld en moeten worden vergeleken met de tekst in de brontaal, die als enige rechtsgeldig is.
Contacts
Inlichtingen / Vragen
https://qleandataset.visual-bank.co.jp/en/contact
Visual Bank Inc.
qlean-dataset@visual-bank.co.jp

