Visual Bank amplia “Qlean Dataset” per supportare i modelli di base (Foundation Models) su ampia scala per la lingua parlata giapponese
Visual Bank amplia “Qlean Dataset” per supportare i modelli di base (Foundation Models) su ampia scala per la lingua parlata giapponese
Forniamo oltre 100.000 ore di audio giapponese con diritti autorizzati, compresi dialetti regionali e discorsi culturalmente contestualizzati essenziali per lo sviluppo commerciale dell'intelligenza artificiale.
TOKYO--(BUSINESS WIRE)--Visual Bank Inc. (CEO: Saneyuki Nagai), attraverso la sua controllata amanaimages Inc., uno dei maggiori fornitori di risorse digitali per il settore del marketing e pubblicitario in Giappone con più di 40 anni di storia, oggi ha annunciato l'espansione del suo Qlean Dataset, una soluzione premium di dati per addestrare l'AI, progettata per gli sviluppatori che costruiscono modelli di base (Foundation Models) della lingua giapponese parlata ad alte prestazioni.
Un nuovo sviluppo all'interno della divisione Qlean Dataset, incentrata sulla fornitura di dataset per istituzioni impegnate in ricerca e sviluppo, con diritti autorizzati per l’addestramento dell’IA e applicazioni su larga scala dei dati, ha posizionato l’azienda come uno dei principali fornitori di infrastrutture di dati per la lingua giapponese, in particolare per corpora strutturati di lingua parlata giapponese organizzati per configurazione dei parlanti e dominio tematico.
Principali caratteristiche per gli sviluppatori di IA
-
Dati con diritti autorizzati per uso commerciale
Tutti i dataset sono completamente autorizzati per l'uso commerciale e conformi agli standard di conformità globali come il GDPR e il CCPA. -
Risorse audio ad alta fedeltà
Le registrazioni a 48kHz/16bit o superiore catturano sia il parlato di qualità professionale che gli ambienti acustici. -
Annotazione umana esperta
Trascrizioni di livello madrelingua e metadati strutturati forniscono dataset pronti per l'addestramento per lo sviluppo dell'IA. -
Dataset per la sicurezza e la moderazione
I dataset supportano il rilevamento di linguaggi dannosi, inclusi incitamenti all'odio e prompt abusivi. -
Dataset di valutazione della lingua giapponese
I dataset di valutazione sono allineati ai parametri di riferimento internazionali come MMSU per misurare il ragionamento e le sfumature linguistiche in giapponese. -
Ambienti acustici specifici del Giappone
L'audio specifico del Giappone, inclusi strumenti tradizionali, santuari e ambienti urbani, supporta l'IA multimodale e spaziale.
AI Data Recipe
https://qleandataset.visual-bank.co.jp/en/lineup
Corpora di lingua giapponese
https://qleandataset.visual-bank.co.jp/en/products/japanese-language-corpora
Il testo originale del presente annuncio, redatto nella lingua di partenza, è la versione ufficiale che fa fede. Le traduzioni sono offerte unicamente per comodità del lettore e devono rinviare al testo in lingua originale, che è l'unico giuridicamente valido.
Contacts
Richieste di informazioni
https://qleandataset.visual-bank.co.jp/en/contact
Visual Bank Inc.
qlean-dataset@visual-bank.co.jp

