Der elektronische Dolmetscher holt auf

Sprachtechnologie ist auf dem Vormarsch. Die automatische Übersetzung von Texten in fremde Sprachen ist inzwischen in vielen Bereichen Alltag, etwa bei Untertiteln im Film. Die Grundlage bilden aber immer noch «menschliche» Übersetzungen.

Von Matthias Schüssler

Lange Zeit tat sich der Computer schwer mit der menschlichen Sprache. Die Resultate von Übersetzungsprogrammen und Steuerungssystemen waren minderwertig und ernteten nur Spott. Doch nun wendet sich das Blatt. Siri, der dienstbare Geist am iPhone, hört auf gesprochene Anweisungen und stellt für viele Anwender eine echte Erleichterung dar. Mit Microsoft Kinect steuert man Spielkonsolen per Stimme. Und die Übersetzungs-App Sayhi, die gesprochene Sätze erkennt und in einer anderen Sprache ausgibt, schlägt sich in alltäglichen Belangen überraschend gut.

Das Interesse an Computerunterstützung sei gestiegen, was sich an Industrie-Sponsorings von Projekten zeige, bestätigt Martin Volk. Er ist Professor am Institut für Computerlinguistik der Universität Zürich und beschäftigt sich mit maschineller Übersetzung. Diese Technologie ist so weit fortgeschritten, dass sich innert weniger Wochen ein System für ein bestimmtes Einsatzgebiet einrichten lässt. Sie macht den menschlichen Übersetzer zwar nicht überflüssig, kann aber seine Arbeitsleistung stark steigern. Und sie macht die Übersetzungen konsistenter, weil das Fachvokabular immer gleich verwendet wird.

Berichte aus der Bergwelt

Die maschinelle Übersetzung kommt nicht nur bei Sachtexten zum Einsatz. Eine unter Mitwirkung der Uni Zürich entwickelte Lösung wird in Skandinavien zum Übersetzen von Untertiteln in Filmen eingesetzt. Mit ihr werden pro Tag für 15 Fernsehprogramme Untertitel erstellt: Sie stammen aus dem Englischen oder Schwedischen und werden ins Dänische und Norwegische übertragen. Das Prinzip ist in den Grundzügen seit 15 Jahren bekannt. Es basiert auf bestehenden Übersetzungen, die von menschlichen Dolmetschern erstellt wurden und statistisch ausgewertet werden. «Das ist ein Recyclingverfahren, das eine Wiederverwendung bestehender Human-Übersetzungen möglich macht», erklärt Martin Volk.

Es ist nicht nötig, dass Sätze als Ganzes übersetzt vorliegen, damit das System sie übertragen kann. Bestandteile davon reichen aus: Der Computer baut aus passenden Versatzstücken die gewünschte Übersetzung zusammen.

Damit diese Methode funktioniert, braucht es grosse Mengen von Text für das jeweilige Sprachpaar. Dieses Material ist heute einfacher zu beschaffen, weil Übersetzungen inzwischen fast ausschliesslich elektronisch erstellt werden und damit digital vorliegen. «Es ist jetzt erst erkannt worden, was sich mit diesem Verfahren alles bewerkstelligen lässt», sagt Volk.

Die Palette der Anwendungen hat sich entsprechend ausgeweitet. Die Forscher der Uni Zürich arbeiten an einem Übersetzungssystem für den Schweizer Alpen-Club, bei dem Berichte aus der Bergwelt vom Deutschen ins Französische und in umgekehrter Richtung übersetzt werden. Das Jahrbuch des SAC ist seit 50 Jahren in beiden Sprachen erhältlich. Das ist, nach der Digitalisierung, genügend Material, um die Übersetzung der Monatszeitschrift «Die Alpen» zu unterstützen. Der Initialaufwand für die Implementierung wird kleiner, und fixfertige kommerzielle Produkte rücken in greifbare Nähe. Mit einer Million human übersetzter Sätze werde sich in fünf Jahren ein eigenes Übersetzungssystem bauen lassen, prognostiziert Volk.

Sitcoms ja, Literatur nein

Liegt genügend übersetztes Material vor, können auch exotische Sprachpaare übersetzt werden. Das Resultat ist bei verwandten Sprachen am besten. Das liegt laut Volk an der ähnlichen Wortstellung und der vergleichbaren Ausdrucksweise. «Doch dank dem Recyclingverfahren können auch idiomatische Formulierungen perfekt übersetzt werden, wenn sie im Trainingsmaterial so oder ähnlich vorhanden waren.»

Die Forscher der Uni Zürich arbeiten an Systemen für die Übersetzung von softwarebezogenen Fehlerberichten und von technischen Dokumentationen aus der Automobilindustrie. Sie lassen aber die Finger von literarischen Werken – sie sind zu facettenreich und zu komplex, als dass das Recyclingverfahren greifen würde.

Fiktive Inhalte sind aber nicht grundsätzlich tabu. Bei den Fernsehuntertiteln gibt es gute Resultate. «Untertitel sind kurz, und typischerweise enthält schon der ursprüngliche, von einem Menschen erstellte Untertitel eine Vereinfachung», sagt Volk. Elliptische Formulierungen, komplexe Verschachtelungen versucht man zu vermeiden.

Sitcoms eignen sich ausgezeichnet für die maschinelle Übersetzung, obwohl die Dialoge mit Wortwitz und Zweideutigkeiten gespickt sind. «Die Sitcoms sind so wiederholend, dass wir sie besser übersetzen können als Dokumentarfilme mit ihrem Fachvokabular», erläutert Volk den erstaunlichen Befund.

Wesentlich für die Qualität der Übersetzungen ist die Spezialisierung. Wenn die Übersetzung auf Trainingsmaterial aus einem bestimmten, scharf abgegrenzten Themenbereich basiert, sind die Resultate besser als beispielsweise bei Google Translate, das mit Texten aus allen möglichen Gebieten gefüttert wurde. Darum werden heute spezifische Systeme für genau definierte Aufgaben gebaut – das universelle Übersetzungssystem, das alles übersetzt, ist so weit entfernt wie eh und je.

Doch was tun, wenn für ein Sprachpaar kaum übersetzte Texte existieren? In diesem Fall könnte der regelbasierte Ansatz greifen. Hier wird versucht, die grammatikalische Struktur des Satzes in der Ausgangssprache zu erfassen, damit er in die Struktur des Zielsatzes umgeformt werden kann. Die Forscher der Uni Zürich arbeiten an einem Übersetzungssystem von Spanisch nach Quechua, einer Sprache, die im Andenraum Südamerikas gesprochen wird und für die wenig schriftliche Texte vorliegen.

Globalisierung der Sprachen

Die maschinelle Übersetzung hat das Ziel, die Effizienz zu steigern und Kosten zu sparen. Aber nicht nur: Sie hilft auch, bei fremdsprachigen Texten zu beurteilen, was damit zu geschehen hat. Die Beamten in der EU beurteilen anhand einer automatischen Übersetzung, wie mit einem in einer der vielen Sprachen der Mitgliedsländer verfassten Antrag zu verfahren ist und wer zuständig ist.

Die EU fördert die maschinelle Übersetzung durch diverse Forschungsprojekte und kann inzwischen alle Sprachkombinationen abdecken: Rund 450 Sprachpaare stehen zur Verfügung, auch für «kleine» Sprachen wie Estnisch oder Slowenisch. Möglich wurde das, weil die EU alle Länder, die Mitglied werden wollten, verpflichtete, die gesamten EU-Gesetze zu übersetzen. Dieses Regelwerk umfasst 30 Millionen Wörter pro Sprache. Es ist in allen 22 Sprachen verfügbar und wird zum Training von Übersetzungssystemen herangezogen.

Und die Schweiz? «Wir stehen zwar in Kontakt mit der Bundeskanzlei, aber wir sind bislang mit den Behörden in Bern nicht ins Geschäft gekommen», sagt Volk bedauernd.

«Die maschinelle Übersetzung war noch nie so spannend wie heute», sagt Martin Volk. Foto: Esther Michel

Quelle: Tages-Anzeiger, Montag, 16. Juli 2012

Rubrik und Tags:

Faksimile
120716 Seite 30.pdf

Die Faksimile-Dateien stehen nur bei Artikeln zur Verfügung, die vor mindestens 15 Jahren erschienen sind.

Metadaten
Thema: Aufmacher
Nr: 10377
Ausgabe:
Anzahl Subthemen: 1

Obsolete Datenfelder
Bilder: 1
Textlänge: 600
Ort:
Tabb: WAHR