Visual Bank erweitert das „Qlean Dataset“ zur Unterstützung umfassender japanischer Sprach-Basismodelle (Foundation Models)
Visual Bank erweitert das „Qlean Dataset“ zur Unterstützung umfassender japanischer Sprach-Basismodelle (Foundation Models)
Bereitstellung von über 100.000 Stunden rechtegeklärtem japanischem Audiomaterial, einschließlich regionaler Dialekte und kulturell kontextbezogener Sprache, die für die Entwicklung kommerzieller KI unerlässlich sind.
TOKIO--(BUSINESS WIRE)--Visual Bank Inc. (CEO: Saneyuki Nagai) hat heute über seine Tochtergesellschaft amanaimages Inc. – einen der größten Anbieter digitaler Ressourcen für die Marketing- und Werbebranche in Japan mit über 40-jähriger Geschichte – die Erweiterung seines „Qlean Dataset“ bekannt gegeben, einer Premium-Lösung für KI-Trainingsdaten, die speziell für Entwickler konzipiert wurde, die leistungsstarke japanische Sprachgrundmodelle erstellen.
Eine neue Entwicklung innerhalb des Geschäftsbereichs „Qlean Dataset“, der sich auf die Bereitstellung von Datensätzen für Forschungs- und Entwicklungseinrichtungen konzentriert, deren Rechte für KI-Training und groß angelegte Datenanwendungen geklärt sind, hat das Unternehmen als führenden Anbieter von Dateninfrastruktur für die japanische Sprache positioniert, insbesondere für strukturierte japanische Sprachkorpora, die nach Sprecherkonfiguration und Themenbereich organisiert sind.
Wichtigste Funktionen für KI-Entwickler
-
Rechtssichere Daten für die kommerzielle Nutzung
Alle Datensätze sind vollständig für die kommerzielle Nutzung freigegeben und entsprechen globalen Compliance-Standards wie der DSGVO (GDPR) und dem CCPA. -
Audioinhalte in Hi-Fi-Qualität
Aufnahmen mit 48 kHz/16 Bit oder höher erfassen sowohl Sprache in Studioqualität als auch akustische Umgebungen. -
Annotation durch Experten
Transkripte in Originalsprache und strukturierte Metadaten liefern trainingsfähige Datensätze für die KI-Entwicklung. -
Datensätze zu Sicherheit und Moderation
Die Datensätze unterstützen die Erkennung von beleidigenden Äußerungen, einschließlich Hassreden und beleidigender Eingabeaufforderungen. -
Japanische Bewertungsdatensätze
Die Bewertungsdatensätze sind auf internationale Benchmarks wie MMSU abgestimmt, um die Argumentationsfähigkeit und sprachliche Nuancen im Japanischen zu messen. -
Japanspezifische akustische Umgebungen
Japan-spezifische Audiodaten, darunter traditionelle Instrumente, Schreine und städtische Umgebungen, unterstützen multimodale und räumliche KI.
Diese Datensätze sind über „AI Data Recipe“ verfügbar, ein flexibles Angebot, das sowohl gebrauchsfertige Datensätze als auch die Erstellung maßgeschneiderter Daten umfasst, einschließlich Sprecherauswahl, Aufnahme und Annotation, die auf bestimmte Modellarchitekturen und Entwicklungsanforderungen zugeschnitten sind.
„Angesichts der steigenden Nachfrage nach kulturell kontextualisierten Grundmodellen gewinnen hochwertige, rechtskonforme japanische Trainingsdaten zunehmend an Bedeutung“, sagte Saneyuki Nagai, CEO von Visual Bank Inc. „Visual Bank hat es sich zum Ziel gesetzt, durch sorgfältige Datenaufbereitung und -verarbeitung die Lücke zwischen Rohdaten und produktionsreifen KI-Systemen zu schließen.“
AI Data Recipe
https://qleandataset.visual-bank.co.jp/en/lineup
Japanische Sprachkorpora
https://qleandataset.visual-bank.co.jp/en/products/japanese-language-corpora
Die Ausgangssprache, in der der Originaltext veröffentlicht wird, ist die offizielle und autorisierte Version. Übersetzungen werden zur besseren Verständigung mitgeliefert. Nur die Sprachversion, die im Original veröffentlicht wurde, ist rechtsgültig. Gleichen Sie deshalb Übersetzungen mit der originalen Sprachversion der Veröffentlichung ab.
Contacts
Anfragen
https://qleandataset.visual-bank.co.jp/en/contact
Visual Bank Inc.
qlean-dataset@visual-bank.co.jp

