Bertin IT stellt brandneue mehrsprachige Spracherkennungslösung MediaSpeech 6 vor

MediaSpeech® bietet die branchenweit höchste Leistungsfähigkeit für die Verarbeitung und die detaillierte Analyse von Medien- und Telekommunikationsdatenbanken.

Bertin IT introduces MediaSpeech v6, its latest multilingual speech recognition solution (Photo: Business Wire)

PARIS--()--Bertin IT (CNIM-Gruppe) meldet die Veröffentlichung der jüngsten Version von MediaSpeech®, der mehrsprachigen Spracherkennungslösung des Unternehmens. Diese konvertiert Audioaufzeichnungen in durchsuchbare Textdateien. Auf diese Weise können Audio- und Videoquellen indexiert, durchsucht und analysiert werden. MediaSpeech® ist jetzt für die Echtzeitverarbeitung von Audioquellen auch als Live-Version erhältlich. Damit ist der Weg für neue interaktive, innovative Kommunikationsanwendungen geebnet.

Mithilfe von tiefen neuronalen Netzwerken (DNN), die üblicherweise in Systemen mit künstlicher Intelligenz eingesetzt werden, erstellt MediaSpeech® ein extrem differenziertes Modell des akustischen Raumes, das zuverlässig auch unterschiedliche Sprecher und akustische Bedingungen erfasst und dadurch eine noch schnellere, präzisere Transkriptionsleistung bietet.

Funktionen:

  • Spracherkennung mit Transkription der einzelnen Wörter innerhalb einer Millisekunde mit ausgewiesenem Verlässlichkeitswert
  • Automatische Erkennung der gerade gesprochenen Sprache (Language Identification bzw. LID)
  • Automatische Segmentierung von Sprechakten und Sprechern mit Geschlechtererkennung
  • Identifizierung des Sprechers anhand einer biometrischen Datenbank
  • Automatische und halbautomatische Anpassung an verschiedene Vokabulare und Fachgebiete

All diese Funktionen werden in 17 verschiedenen Sprachen unterstützt.

MediaSpeech® ist in verschiedenen Ausführungen erhältlich: MediaSpeech® Factory als Vor-Ort-Lösung oder als SaaS-Lösung, die in der Cloud von Bertin IT gehostet wird, ist in der Lage, umfangreiche Dateimengen mit garantierter Leistungsfähigkeit zu verarbeiten. Die neue Version MediaSpeech® Live ist in der Lage, Audiostreams in Echtzeit zu transkribieren. Damit ist der Weg für innovative Echtzeitanwendungen geebnet, etwa zu sprachgesteuerten Chatbots, Callbots oder funktionserweiterten Callcentern (charakteristisch für solche Callcenter ist, dass die Berater während des Anrufs unterstützt werden und so die Qualität der Dialoge optimiert werden kann.)

Einige der wichtigsten Verbesserungen in der neuen Version von MediaSpeech®:

  • MediaSpeech® Live zur Verarbeitung von Audiostreams in Echtzeit
  • Neue neuronale Modelle sorgen für eine zwei- bis dreimal schnellere und genauere Transkription
  • Alle Sprachverarbeitungsmodule sind jetzt „vollständig“ neuronal: noch höhere Präzision durch Sprechpausenerkennung (VAD) und Unterscheidung verschiedener Sprecher (Sprecher-Diarisation)
  • Einfache Installation, höhere Sicherheit und neue Schnittstellen
  • Vollständig neuronales Sprachidentifikationsmodul (LID) mit verbesserter Genauigkeit, auch bei relativ kurzen Sprachabschnitten.

MediaSpeech® 6 wird bereits von mehreren Kunden genutzt, beispielsweise von einer großen französischen Investment- und Finanzbank. Die Version MediaSpeech Live wurde vor Kurzem an eine weitere große Bankengruppe ausgeliefert, wo sie in deren Kundenkontaktcentern zum Einsatz kommt.

Die Ausgangssprache, in der der Originaltext veröffentlicht wird, ist die offizielle und autorisierte Version. Übersetzungen werden zur besseren Verständigung mitgeliefert. Nur die Sprachversion, die im Original veröffentlicht wurde, ist rechtsgültig. Gleichen Sie deshalb Übersetzungen mit der originalen Sprachversion der Veröffentlichung ab.

Contacts

Nathalie Sablon
nathalie.sablon@cnim.com

Contacts

Nathalie Sablon
nathalie.sablon@cnim.com