Letzte Woche haben wir über das aktuelle Projekt der Swisscom berichtet – das Unternehmen setzt neu Technologien der Stimm- und Sprecherkennung für ihre Hotline ein. Voiceprint setzt auf Sprecherkennung, Call Centers nutzen jedoch vermehrt auch die Möglichkeiten der Spracherkennung. Wo liegen die Unterschiede?
Spracherkennung
Über Spracherkennung werden gesprochene Worte und Sätze analysiert, semantisch ausgewertet und zu nutzbaren Resultaten verarbeitet.
Anwendungen
Die Technologien und Methoden der Spracherkennung öffnen eine Vielzahl von Anwendungsbereichen. Zum Beispiel lassen sich Texte am PC oder mobil diktieren und automatisch erfassen und brauchen nicht getippt zu werden. Die Softwarepakete Dragon von Nuance sind seit Jahren führend in diesem Bereich. Oder Kundenservice an Automaten und im Web: der Kunde stellt mündlich Fragen und erhält vom System automatisch die richtigen Antworten. Oder auch die inzwischen hoch entwickelten Sprachassistenten wie Siri von Apple, die nicht nur gesprochene Anfragen ausführen, sondern immer mehr auch zu "Gesprächspartnern" werden und teilweise komplexe Fragen kompetent beantworten können.
Die Anwendungsfelder sind inzwischen sehr weit gefasst, im Kern geht es bei der Spracherkennung um die Interaktion und den Austausch von Informationen zwischen Mensch und Maschine – über das Mittel der Sprache.
Sprecherkennung
Sprecherkennung zielt auf den Sprechenden selbst, der identifiziert werden soll. Aufgrund seiner Sprechweise, Frequenz, Geschwindigkeit, Aussprache, Akzent, Sprachrhythmus und weiteren Merkmalen, die für diesen einen Menschen typisch und einzigartig sind.
Anwendungen
Ausgefeilte Technologien der Sprecherkennung ermöglichen die eindeutige Identifizierung des Sprechenden und lassen sich innerhalb von sicherheitsrelevanten Bereichen einsetzen. Zum Beispiel für Zugriffs- oder Zutrittsberechtigungen und damit verbundene Autorisierungen und Freigaben. Voiceprints gehören auch im Finanzbereich und Zahlungsverkehr zu den biometrischen Authentifizierungsverfahren, neben Fingerprint und Gesichtserkennung, die Passwort-Systeme ablösen werden.
Spracherkennung und Sprecherkennung in Kombination
Das Schweizer Startup-Unternehmen Spitch gehört zu den Spezialisten in den Bereichen der Spracherkennung, Analyse und Sprecherkennung. Das Video zeigt beispielhaft eine kombinierte Anwendung der Technologien in Call Centers und für Hotlines.
Spitch: Anwendung Sprachtechnologien und Services
Spitch: Nochmals dasselbe, aber statt Deutsch in Schwiizerdütsch
Mehr zum Thema: Event "Speech Technology Trends", Zürich, 22. September 2016
Nuance: Beispiele Spracherkennung mit Dragon Software
Stichworte zum Thema im Lexikon: Biometrische Authentifizierung