Visual Bank amplia “Qlean Dataset” per supportare i modelli di base (Foundation Models) su ampia scala per la lingua parlata giapponese

Forniamo oltre 100.000 ore di audio giapponese con diritti autorizzati, compresi dialetti regionali e discorsi culturalmente contestualizzati essenziali per lo sviluppo commerciale dell'intelligenza artificiale.

original Visual Bank Group, sfruttando oltre 40 anni di esperienza attraverso amanaimages inc., amplia «Qlean Dataset» per offrire corpora di lingua giapponese di alta qualità e con diritti autorizzati, includendo oltre 100.000 ore di audio per uso commerciale.

Visual Bank Group, sfruttando oltre 40 anni di esperienza attraverso amanaimages inc., amplia «Qlean Dataset» per offrire corpora di lingua giapponese di alta qualità e con diritti autorizzati, includendo oltre 100.000 ore di audio per uso commerciale.

TOKYO--(BUSINESS WIRE)--Visual Bank Inc. (CEO: Saneyuki Nagai), attraverso la sua controllata amanaimages Inc., uno dei maggiori fornitori di risorse digitali per il settore del marketing e pubblicitario in Giappone con più di 40 anni di storia, oggi ha annunciato l'espansione del suo Qlean Dataset, una soluzione premium di dati per addestrare l'AI, progettata per gli sviluppatori che costruiscono modelli di base (Foundation Models) della lingua giapponese parlata ad alte prestazioni.

Un nuovo sviluppo all'interno della divisione Qlean Dataset, incentrata sulla fornitura di dataset per istituzioni impegnate in ricerca e sviluppo, con diritti autorizzati per l’addestramento dell’IA e applicazioni su larga scala dei dati, ha posizionato l’azienda come uno dei principali fornitori di infrastrutture di dati per la lingua giapponese, in particolare per corpora strutturati di lingua parlata giapponese organizzati per configurazione dei parlanti e dominio tematico.

Principali caratteristiche per gli sviluppatori di IA

Dati con diritti autorizzati per uso commerciale
Tutti i dataset sono completamente autorizzati per l'uso commerciale e conformi agli standard di conformità globali come il GDPR e il CCPA.
Risorse audio ad alta fedeltà
Le registrazioni a 48kHz/16bit o superiore catturano sia il parlato di qualità professionale che gli ambienti acustici.
Annotazione umana esperta
Trascrizioni di livello madrelingua e metadati strutturati forniscono dataset pronti per l'addestramento per lo sviluppo dell'IA.
Dataset per la sicurezza e la moderazione
I dataset supportano il rilevamento di linguaggi dannosi, inclusi incitamenti all'odio e prompt abusivi.
Dataset di valutazione della lingua giapponese
I dataset di valutazione sono allineati ai parametri di riferimento internazionali come MMSU per misurare il ragionamento e le sfumature linguistiche in giapponese.
Ambienti acustici specifici del Giappone
L'audio specifico del Giappone, inclusi strumenti tradizionali, santuari e ambienti urbani, supporta l'IA multimodale e spaziale.

AI Data Recipe
https://qleandataset.visual-bank.co.jp/en/lineup

Corpora di lingua giapponese
https://qleandataset.visual-bank.co.jp/en/products/japanese-language-corpora

Il testo originale del presente annuncio, redatto nella lingua di partenza, è la versione ufficiale che fa fede. Le traduzioni sono offerte unicamente per comodità del lettore e devono rinviare al testo in lingua originale, che è l'unico giuridicamente valido.

Contacts

Richieste di informazioni
https://qleandataset.visual-bank.co.jp/en/contact

Visual Bank Inc.
qlean-dataset@visual-bank.co.jp

Industry:

Back to Newsroom

Services & Solutions

Services

Solutions For

Resources

Education

Why Business Wire

Visual Bank amplia “Qlean Dataset” per supportare i modelli di base (Foundation Models) su ampia scala per la lingua parlata giapponese

Contacts

Visual Bank Inc.

Contacts

Visual Bank Inc.

Contacts