Der Menschenverstand bleibt massgebend

Sprach-Apps Eine neue Studie zeigt die Grenzen des digitalen Sprachverständnisses auf. Doch auch wenn die Computer uns nicht perfekt verstehen – nützliche Dienste leisten sie trotzdem.

Matthias Schüssler

«Die künstliche Intelligenz hat noch immer nicht gesunden Menschenverstand, um unsere Sprache wirklich zu verstehen», hat die «Technology Review», das Magazin des Massachusetts Institute of Technology (MIT) letzte Woche geurteilt.

Grund für das harsche Urteil ist ein Test zum Begriffsvermögen: Bei diesem Winograd Schema Challenge bekommen die Programme viele Satzpaare vorgesetzt, die sich nur in einem Wort unterscheiden. Beim Satzpaar «Die Trophäe passt nicht in die Kiste, weil sie zu gross ist» – «Die Trophäe passt nicht in die Kiste, weil sie zu klein ist» leuchtet jedem menschlichen Leser ein, dass sich das Pronomen «sie» im ersten Satz auf die Trophäe, im zweiten Satz auf die Kiste bezieht.

Den Algorithmen hingegen ist das nicht so klar. Sie haben jüngst bei diesem Test markant schlechter abgeschnitten als menschliche Leser (zwischen 59 und 79 Prozent gegenüber 94 Prozent Genauigkeit). Die Forscher des Allen Institute of Artificial Intelligence, die den Test durchgeführt haben, kamen zu einem klaren Schluss: Dem menschlichen Verstand ist mit den aktuellen Mitteln der künstlichen Intelligenz nicht beizukommen.

Beeindruckende Fortschritte

Die heutigen Systeme setzen auf das Deep Learning, das mit statistischen Methoden in riesigen Datenbergen nach Mustern und Strukturen sucht. Es nutzt zusätzlich auch Modelle, die den Systemen das Wissen der Welt zugänglich machen.

Doch auch wenn die Algorithmen noch Verbesserungspotenzial haben: Die Fortschritte im letzten Jahrzehnt waren beeindruckend – wenn man bedenkt, wie die Anfänge ausgesehen haben. Ein erstes System war Audrey. Es wurde 1952 von Ingenieuren der Bell Labs konstruiert. Audrey konnte die Zahlen von 0 bis 9 mit mehr als 90 Prozent Genauigkeit erkennen – jedoch nur dann, wenn sie von bestimmten Sprechern gesprochen wurden.

1962 kam IBMs Erfindung Shoebox. Sie verstand die Ziffern, plus 16 englische Worte. Harpy, 1971 an der Carnegie-Mellon Universität in Pittsburgh entwickelt, hatte schon ein Verständnis für 1011 Wörter. Die erste Software, die kontinuierlich gesprochene Sprache verstehen konnte, war Dragon Dictate von 1997.

Die grossen Durchbrüche erfolgten 2008 und 2011: Vor zwölf Jahren hat Google eine iPhone-App lanciert, die auf gesprochene Fragen reagierte. Vor neun Jahren, mit dem iPhone 4s, hat Apple Siri eingeführt. Die Fortschritte bei den Sprachfähigkeiten haben nicht nur den Smartphone-Assistenten, sondern auch den vernetzten Lautsprechern den Weg geebnet.

Die anfänglichen Schwellenängste der Nutzer sind in den letzten Jahren zurückgegangen. Laut einer Studie haben 2017 etwas mehr als die Hälfte der Amerikaner per Sprache mit ihrem Smartphone interagiert. In der Schweiz waren es vor einem Jahr 37 Prozent; so hat es eine Studie der Universität Luzern und der Kommunikationsagentur Farner ergeben.

Aber wie ist es für den Computer, menschliche Sprache verstehen zu müssen? Der Philosph John Searle hat dafür 1980 ein Gedankenexperiment entworfen: Es ist, wie wenn Sie allein in einem dunklen Raum sitzen würden. Ab und zu wird Ihnen durch einen Schlitz ein Zettel mit chinesischen Schriftzeichen zugeworfen. Es handelt sich um Fragen, die Sie allein anhand der Bücher, die um Sie herum aufgestapelt sind, entschlüsseln und beantworten müssen.

Und so gesehen schlagen sich die Computer bei der Kommunikation mit uns gar nicht mal so schlecht.

C-3PO, der goldene Roboter aus «Star Wars» beherrscht fliessend sechs Millionen intergalaktische Sprachen. Foto: PD

Fast perfekte Übersetzungen

Deepl.com hat vor zwei Jahren die Latte für maschinelle Übersetzungen höher gelegt. Der Dienst aus Köln macht menschliche Übersetzer nicht überflüssig. Aber er liefert eine so gute Grundlage, dass mit wenig Nachbearbeitungsaufwand stimmige Übertragungen entstehen. Nebst der kostenlosen Web-App gibt es eine Pro-Variante, die u.a. höheren Ansprüchen an den Datenschutz Rechnung trägt. (schü.)

Aufnahmen transkribieren

Trint.com verschriftlicht Aufnahmen, die man per Video- oder Audiodatei hochlädt. Die Software kann Sprecher unterscheiden und kann auch mit Wörtern vertraut gemacht werden, die sie von Haus aus nicht versteht. Die Transkription ist unter guten Umständen – also bei einer deutlichen Sprechweise und guter Audioqualität – absolut brauchbar. Namen und Fachbegriffe wird man aber auf alle Fälle manuell korrigieren müssen. (schü.)

Texte automatisch kürzen

Resoomer.com erstellt Textzusammenfassungen. Im automatischen Modus sucht er selbsttätig nach Kürzungsmöglichkeiten. Bei Texten ohne «Luft» teilt er mit, es sei keine Verdichtung nötig. Im manuellen Modus lässt sichdie angestrebte Länge in Prozent angeben. Interessant die Analyse: Sie hebt Passagen hervor, die der Algorithmus für wichtig hält. Für Deutsch, Englisch, Französisch, Italienisch und Spanisch. (schü.)

Microsofts Simultanübersetzer

2014 war es eine echte Sensation: Microsoft demonstrierte damals, wie sich per Skype geführte Gespräche annähernd in Echtzeit simultan übersetzen lassen. Heute ist Skype Translator standardmässig für Chats und Sprache verfügbar. Im August 2019 geriet Microsoft in die Kritik, als bekannt wurde, dass Mitarbeiter Aufnahmen solcher übersetzter Gespräche zur Qualitätssicherung auswerten. (schü.)

Leichter verständliche Texte

Grammarly.com verbessert mit künstlicher Intelligenz die Textqualität – bislang nur auf Englisch: Nicht nur Rechtschreibung und Grammatik werden überprüft, sondern auch die Lesbarkeit und die Wirkung auf den Leser: Fühlt er sich angesprochen, ist der Ton und die Ansprache stimmig? In den Einstellungen lässt sichfestlegen, an wen sichder Textrichtet, welchen Zweck er hat und wie formell er sein soll. (schü.)

Korrektur und Stilberatung

Languagetool.org merzt Tipp-, Rechtschreib- und Grammatikfehler aus und lässt sich für kürzere Texte auch direkt im Browser und ohne Anmeldung verwenden. Nebst Deutsch beherrscht dieser digitale Korrektor eine Vielzahl weiterer Sprachen, auch Französisch, Englisch, Italienisch und – falls das heute noch relevant sein sollte – Esperanto. Auch eine rudimentäre Stilanalyse wird durchgeführt. (schü.)

Lesbarkeit auf dem Prüfstand

Wortliga.de untersucht die Lesbarkeit von deutschsprachigen Texten. Lange Sätze und Wörter, unpersönliche Formulierungen, Füllwörter, nutzlose Adjektive und andere aus stilistischer Sicht problematische Eigenschaften werden farblich markiert. Die Web-Anwendung gibt auch eine Einschätzung, wie verständlich und interessant der Text ist und wie lang es dauert, ihn zu lesen. (schü.)

Plagiate aufspüren

Plagscan.com untersucht Texte auf ihre Authentizität. Falls Teile davon aus dem Netz, aus akademischen oder wissenschaftlichen Texten stammen, dann deckt diese Software das auf – ausser, natürlich, wenn es sich um ordentlichdeklarierte Zitate handelt. Die Algorithmen sollen auch greifen, wenn ein Plagiator den Text umgeschrieben hat. Es ist möglich, eigene Dokumente für den Abgleich zu hinterlegen. (schü.)

Völkerverbindende Technik

Ablo.live ist ein soziales Netzwerk, das Menschen auch über die Sprachbarrieren hinweg verbindet. Text- und Videochats werden maschinell in die Sprache des jeweiligen Nutzers übersetzt. Die Vermittlung zwischen den Kontaktwilligen findet automatisch statt, sodass Leute zusammenfinden, die sich sonst wohl kaum begegnen würden. Obdie Technik immer verständlichübersetzt, ist aber eine andere Frage. (schü.)

Schreiben wie Shakespeare

Iwl.me (I Write Like) verrät uns nun endlich, welchem berühmten Autor unsere Schreibe am ähnlichsten ist: Ist es Agatha Christie, H. G. Wells, Mark Twain, Stephen King – oder doch Ernest Hemingway oder William Shakespeare? Man trägt ein paar in Englisch verfasste Sätze ein und erhält umgehend das Verdikt. Der Algorithmus ist übrigens der gleiche, mit dem auch unerwünschte Spam-Mails erkannt werden. (schü.)

Quelle: Tages-Anzeiger, Mittwoch, 5. Februar 2020

Rubrik und Tags:

Faksimile
200205 TA Seite 33.pdf

Die Faksimile-Dateien stehen nur bei Artikeln zur Verfügung, die vor mindestens 15 Jahren erschienen sind.

Metadaten
Thema: Aufmacher
Nr: 15461
Ausgabe:
Anzahl Subthemen: 1

Obsolete Datenfelder
Bilder:
Textlänge:
Ort:
Tabb: FALSCH