Wie unsere Stimme alles über uns verrät

Die Stimmbiometrie identifiziert jeden Menschen – ob er will oder nicht. Auch die Swisscom setzt die Technik ein und wird deswegen kritisiert.

Matthias Schüssler

Gespräche mit einer Telefonhotline fangen üblicherweise mit Sicherheitsfragen zum Wohnort oder Jahrgang an. Bei der Swisscom fällt dieses Ritual seit einiger Zeit weg. Anrufer werden anhand eines sogenannten Stimmabdrucks identifiziert.

Mediensprecherin Sabrina Hubacher erklärt, wie das funktioniert: «Voiceprint misst verschiedene Stimmmerkmale wie zum Beispiel Frequenz, Geschwindigkeit, Aussprache, Akzent. Aus diesen zahlreichen Merkmalen entsteht ein individueller Stimmabdruck.» Das passiert innert Sekunden, automatisch und im Hintergrund.

Das Verfahren sei sicher, verspricht das Telecomunternehmen: Analysiert wird nicht der Klang der Stimme oder was gesagt wird. Die Merkmale des Voiceprints werden weder durch eine Erkältung oder Heiserkeit noch durch Alterung der Stimmbänder verändert. Darum sollen selbst Verwandte mit sehr ähnlichen Stimmen das System nicht überlisten können. Falls die Erkennung zum Beispiel wegen Hintergrundgeräuschen nicht eindeutig ist, kommen die herkömmlichen Sicherheitsfragen zum Einsatz.

Kritik am Verfahren

Der Telecomanbieter weist die Anrufer am Anfang des Gesprächs mit einer automatisierten Ansage auf Voiceprint hin. Wer nicht möchte, dass seine Stimme profiliert wird, kann gegenüber dem Hotline-Mitarbeiter Widerspruch einlegen oder sich über das Online-Kundencenter austragen. Die Online-Kommunikationsberaterin Su Franke findet das nicht ausreichend: Der Hinweis auf das Stimmprofil beginnt mit dem altbekannten Satz, dass Gespräche zu Schulungszwecken aufgezeichnet werden können. Wer ab und zu an Kundenhotlines hängt, hat den Satz schon oft gesagt bekommen. Das dürfte zur Folge haben, dass viele nicht so genau hinhören. «Die Swisscom agiert nicht transparent», kritisiert Su Franke: «Kein Widerspruch gilt als Einverständnis.»

Franke hat letzte Woche auf Twitter protestiert und viel an Echo ausgelöst. Sie ist überzeugt, dass viele Leute nicht wissen, worauf sie sich einlassen: Aus einem Stimmenprofil würde sich viel mehr herauslesen lassen als nur die Identität. Algorithmen könnten Rückschlüsse auf Krankheit, Charakter oder soziales Verhalten ziehen. Solche biometrischen Informationen könnten durch Datendiebstahl in falsche Hände geraten: «Jeder Mensch würde sie schützen wollen, sobald er sich dessen bewusst ist.»

Die Stimme verrät, wie wir aussehen

Die Swisscom betont, ihr Dateiformat lasse keine andere Verwendung als jene für die Kundenidentifikation zu. Denn es ist tatsächlich verblüffend, was sich aus universellen Stimmprofilen alles herauslesen lässt. Letztes Jahr berichtete «Fortune» von den sogenannten Mikrosignaturen. Sie liefern Hinweise auf Stimmung und Rauschzustand, Grösse und Gewicht, Ethnie und die Herkunft des Sprechers. Sogar das Aussehen lässt sich ermitteln. Forscher der Carnegie Mellon University in Pittsburgh sind dabei, eine Methode zu entwickeln, die anhand der Stimme ein 3-D-Porträt skizziert. Falls das zuverlässig funktioniert, bedeutet dies das Ende anonymer Telefonstreiche. Und der Anfang von ganz neuen Methoden der Verbrechensbekämpfung. Mit einer Audioaufnahme eines Bruchteils einer Sekunde würden sich Kriminelle überführen lassen.

Die Unternehmen versprechen sich vom Stimmabdruck nicht nur eine Identifikation von legitimen Kunden, sondern auch Schutz vor Täuschung: Banken führen schwarze Listen von Kreditkartenbetrügern und Identitätsdieben. Weitgehend unbemerkt von der Öffentlichkeit, haben in den letzten Jahren nicht nur Telecomunternehmen, sondern auch Banken und Versicherungen solche Stimmerkennungssysteme eingerichtet. Die Zeitung «The Guardian» schrieb Ende 2018, die britische Grossbank HSBC würde jede Woche mehr als 10’000 Leute registrieren.

5 Milliarden Identifikationen pro Jahr

Der Analyst Opus Research schätzt, dass es bis Ende 2020 von 600 Millionen Menschen ein Stimmprofil geben wird (PDF. 2017 waren es noch 160 Millionen. Nuance ist nach eigenen Angaben der wichtigste Lieferant für Stimmbiometrie-Lösungen – mancher Anwender dürfte ihn auch von Text- und Spracherkennungsprogrammen kennen. Nuance spricht von einem rasanten Wachstum in den letzten Jahren, seit 2001 die erste kommerzielle Lösung implementiert wurde: 2012 war das Interesse geweckt, und 2016 erreichte die Stimmbiometrie den Massenmarkt. Heute finden fünf Milliarden Identifikationen pro Jahr statt.

In diesem Werbevideo zeigt der Softwarehersteller Nuance, wie die Stimme das Passwort ersetzt.

Nuance rührt denn auch kräftig die Werbetrommel für die Stimmerkennung: Sie sei einfach einzuführen und habe gewichtige Vorteile gegenüber dem klassischen Passwort (PDF. Selbst wenn Hacker die Stimmprofile erbeuten würden, seien die wertlos. Sie funktionierten nur in eine Richtung und ermöglichten keine Rekonstruktion der Stimme oder Sprechweise. Ausserdem «sind die physikalischen Charakteristika unnachahmlich, auch wenn sich Sprachrhythmus, Intonation oder Akzent imitieren lassen» – so lautet die Behauptung der Industrie.

Doch selbst wenn die Stimme ein perfektes Passwort sein sollte, sind die neuen Risiken für die Privatsphäre nicht zu übersehen: Stimmprofile lassen sich einfach erstellen, problemlos auch ohne Wissen und Zustimmung des Betroffenen. Jede App, die Spracheingaben entgegennimmt, könnte von der NSA oder irgendeinem anderen Geheimdienst für heimliche Profilierung missbraucht werden, warnte ein Experte schon 2016 im Wirtschaftsmagazin Forbes.com.

Ob solche heimlich erfassten Stimmabdrücke existieren oder nicht, wissen wir nicht. Doch eines ist klar: Ist der Stimmabdruck einmal registriert, kann eine Person bis ans Ende ihres Lebens erkannt und benannt werden, sobald sie den Mund aufmacht. Und natürlich lässt sich die Stimmbiometrie mit anderen Tracking-Massnahmen kombinieren. Sie ist ein weiteres Puzzleteilchen, wenn es um eine lückenlose Überwachung geht.

Sogar die Stimmung wird live analysiert

Die Stimmbiometrie gelangt in unseren Alltag, ohne dass eine breite Diskussion darüber stattfinden würde. Republik.ch hat neulich aufgezeigt, wie Unternehmen die Stimmen von Bewerbern analysieren lassen und selbst mit absolut belanglosen Gesprächen ein ziemlich treffsicheres Charakterprofil erstellen. Precire ist das Unternehmen hinter dieser Software. Es analysiert nicht nur den Charakter, sondern auch die Laune, und zwar live während Kundengesprächen: «Das erlaubt Ihnen, Ihre Sprache individuell und typengerecht auf Kunden zuzuschneiden.» Man muss sich allerdings fragen, ob sich die Kunden fair behandelt fühlen, wenn sie derartig durchleuchtet werden.

Da ist es eigentlich beruhigend, dass die Technik offenbar nicht so perfekt ist, wie die Entwickler behaupten: 2017 schaffte es ein Moderator der BBC, sich ins Bankkonto seines Bruders einzuloggen, indem er dessen Stimme nachahmte. Und es sind längst Algorithmen in Entwicklung, die anhand kurzer Stimmproben einen Sprecher perfekt imitieren: Wer sich nicht analysieren lassen will, wird vielleicht irgendwann einen Roboter seine Bankanrufe tätigen lassen.

Beim Gespräch mit Hotlines werden wir anhand unserer Stimme identifiziert, und auch unsere Stimmung wird kontinuierlich analysiert. Bild: Moose Photos/Pexels.com, Public Domain-ähnlich

Quelle: Newsnetz, Dienstag, 5. März 2019

Rubrik und Tags:

Metadaten
Thema: Newsnet
Nr: 15233
Ausgabe:
Anzahl Subthemen: 80

Obsolete Datenfelder
Bilder:
Textlänge:
Ort:
Tabb: FALSCH