Visual Bank erweitert das „Qlean Dataset“ zur Unterstützung umfassender japanischer Sprach-Basismodelle (Foundation Models)

Bereitstellung von über 100.000 Stunden rechtegeklärtem japanischem Audiomaterial, einschließlich regionaler Dialekte und kulturell kontextbezogener Sprache, die für die Entwicklung kommerzieller KI unerlässlich sind.

original Die Visual Bank Group erweitert das „Qlean Dataset“ auf Basis der über 40-jährigen Expertise von amanaimages und bietet hochwertige, rechtssichere japanische Sprachkorpora mit über 100.000 Stunden kommerziell nutzbarer Audiodaten.

Die Visual Bank Group erweitert das „Qlean Dataset“ auf Basis der über 40-jährigen Expertise von amanaimages und bietet hochwertige, rechtssichere japanische Sprachkorpora mit über 100.000 Stunden kommerziell nutzbarer Audiodaten.

TOKIO--(BUSINESS WIRE)--Visual Bank Inc. (CEO: Saneyuki Nagai) hat heute über seine Tochtergesellschaft amanaimages Inc. – einen der größten Anbieter digitaler Ressourcen für die Marketing- und Werbebranche in Japan mit über 40-jähriger Geschichte – die Erweiterung seines „Qlean Dataset“ bekannt gegeben, einer Premium-Lösung für KI-Trainingsdaten, die speziell für Entwickler konzipiert wurde, die leistungsstarke japanische Sprachgrundmodelle erstellen.

Eine neue Entwicklung innerhalb des Geschäftsbereichs „Qlean Dataset“, der sich auf die Bereitstellung von Datensätzen für Forschungs- und Entwicklungseinrichtungen konzentriert, deren Rechte für KI-Training und groß angelegte Datenanwendungen geklärt sind, hat das Unternehmen als führenden Anbieter von Dateninfrastruktur für die japanische Sprache positioniert, insbesondere für strukturierte japanische Sprachkorpora, die nach Sprecherkonfiguration und Themenbereich organisiert sind.

Wichtigste Funktionen für KI-Entwickler

Rechtssichere Daten für die kommerzielle Nutzung
Alle Datensätze sind vollständig für die kommerzielle Nutzung freigegeben und entsprechen globalen Compliance-Standards wie der DSGVO (GDPR) und dem CCPA.
Audioinhalte in Hi-Fi-Qualität
Aufnahmen mit 48 kHz/16 Bit oder höher erfassen sowohl Sprache in Studioqualität als auch akustische Umgebungen.
Annotation durch Experten
Transkripte in Originalsprache und strukturierte Metadaten liefern trainingsfähige Datensätze für die KI-Entwicklung.
Datensätze zu Sicherheit und Moderation
Die Datensätze unterstützen die Erkennung von beleidigenden Äußerungen, einschließlich Hassreden und beleidigender Eingabeaufforderungen.
Japanische Bewertungsdatensätze
Die Bewertungsdatensätze sind auf internationale Benchmarks wie MMSU abgestimmt, um die Argumentationsfähigkeit und sprachliche Nuancen im Japanischen zu messen.
Japanspezifische akustische Umgebungen
Japan-spezifische Audiodaten, darunter traditionelle Instrumente, Schreine und städtische Umgebungen, unterstützen multimodale und räumliche KI.

Diese Datensätze sind über „AI Data Recipe“ verfügbar, ein flexibles Angebot, das sowohl gebrauchsfertige Datensätze als auch die Erstellung maßgeschneiderter Daten umfasst, einschließlich Sprecherauswahl, Aufnahme und Annotation, die auf bestimmte Modellarchitekturen und Entwicklungsanforderungen zugeschnitten sind.

„Angesichts der steigenden Nachfrage nach kulturell kontextualisierten Grundmodellen gewinnen hochwertige, rechtskonforme japanische Trainingsdaten zunehmend an Bedeutung“, sagte Saneyuki Nagai, CEO von Visual Bank Inc. „Visual Bank hat es sich zum Ziel gesetzt, durch sorgfältige Datenaufbereitung und -verarbeitung die Lücke zwischen Rohdaten und produktionsreifen KI-Systemen zu schließen.“

AI Data Recipe
https://qleandataset.visual-bank.co.jp/en/lineup

Japanische Sprachkorpora
https://qleandataset.visual-bank.co.jp/en/products/japanese-language-corpora

Die Ausgangssprache, in der der Originaltext veröffentlicht wird, ist die offizielle und autorisierte Version. Übersetzungen werden zur besseren Verständigung mitgeliefert. Nur die Sprachversion, die im Original veröffentlicht wurde, ist rechtsgültig. Gleichen Sie deshalb Übersetzungen mit der originalen Sprachversion der Veröffentlichung ab.

Contacts

Anfragen
https://qleandataset.visual-bank.co.jp/en/contact

Visual Bank Inc.
qlean-dataset@visual-bank.co.jp

Industry:

Back to Newsroom

Services & Solutions

Services

Solutions For

Resources

Education

Why Business Wire

Visual Bank erweitert das „Qlean Dataset“ zur Unterstützung umfassender japanischer Sprach-Basismodelle (Foundation Models)

Contacts

Visual Bank Inc.

Contacts

Visual Bank Inc.

Contacts