Intelligentes Unternehmen: Was bedeutet das für die Übersetzungsindustrie?

Intelligent enterprise - what does it mean for contemporary translation technology?

In den letzten beiden Einträgen zum Thema Bridging & NMT (Teil 1 und Teil 2) wurde neuronale maschinelle Übersetzung (NMT) recht kritisch beleuchtet. Es wäre jedoch falsch, maschinelle Übersetzung einfach als eine minderwertige Alternative zur Humanübersetzung abzutun, die nebenbei noch Arbeitsplätze gefährdet. Dieser Beitrag soll ein Anwendungsfall zeigen, wie NMT erfolgreich und produktiv eingesetzt werden kann. In diesem Fall von unserem langjährigen Kunden SAP.

2018 begann SAP, sein eigenes NMT-Modell in der Praxis zu nutzen. Die Ergebnisse dieser noch recht jungen künstlichen Intelligenz sind jedoch beeindruckend. Selbst unsere erfahrensten (und damit einhergehend kritischsten) Übersetzerinnen und Übersetzer attestierten den Übersetzungen einen unerwartet hohen Grad an sprachlicher Korrektheit, terminologischer Konsistenz und SAP-spezifischer Stilechtheit. In erstaunlich vielen Fällen können die Übersetzungen komplett ohne Anpassungen übernommen werden. Das wirkt sich natürlich positiv auf die Produktivität aus, von erhöhter Qualität durch textübergreifende Konsistenz ganz zu schweigen.

Nun ist SAP für vieles bekannt, allerdings wohl eher weniger für seine jahrzehntelange Position als Speerspitze in der Entwicklung künstlicher Intelligenz. Zwar setzt das Unternehmen jetzt schon seit ein paar Jahren auf das Prinzip des intelligenten Unternehmens, dennoch war ich persönlich überrascht. Nicht zuletzt, weil bei herkömmlichen Systemen der maschinelle Fußabdruck besonders bei Übersetzungen ins Deutsche in der Regel noch gut zu erkennen ist. Falls Sie also gerade Deutsch lernen und Ihnen beim Thema Satzstellung und getrennte Verben das Blut in den Kopf steigt, seien Sie beruhigt. Maschinen tun sich erfahrungsgemäß ähnlich schwer.

Wie kann es also sein, dass die Ergebnisse bei SAP so gut sind? Bevor diese Frage beantwortet werden kann, sind einige Hintergrundinformationen notwendig. Denn je komplexer die Anwendung, desto sorgfältiger muss eine erfolgreiche NMT-Implementierung vorbereitet werden.

SAPs NMT ist nicht der erste maschinelle Übersetzer, den SAP für seine Übersetzungsprozesse einsetzt. Schon lange zuvor wurde bereits ein SMT-System (Statistical Machine Translation) für einen Teilbereich der SAP-Übersetzungen verwendet, das jedoch nur bedingt befriedigende Ergebnisse lieferte. Dafür  ist SAP allerdings nicht selbst verantwortlich. SMTs gelten heute als überholt, denn in Kombination mit fusionierenden Sprachen wie dem Deutschen oder agglutinierenden wie dem Japanischen sind die Ergebnisse oft nicht weniger als haarsträubend. Da die SMT-Übersetzungen für einige Sprachkombinationen in vielen Fällen komplett überarbeitet werden mussten, lag es nahe, die Verwendung dieses SMT-Modells kritisch zu überdenken.. Der Übersetzungsteilbereich, an dem die SMT getestet wurde, wurde dann auch zum Versuchskaninchen für SAPs NMT, mit besagtem Erfolg. Die Übersetzungen waren zwar zu Beginn nicht perfekt, aber nach Aussage unserer Übersetzer war die Lernkurve der Maschine mit bloßem Auge zu erkennen.

Die Maschine übernimmt damit einen Teil der Arbeit der Übersetzer. Leere Zielsegmente werden mit einer Vorübersetzung befüllt, so lange der Algorithmus nicht selber errechnet, dass die Vorübersetzung wahrscheinlich falsch sein wird. Somit werden einige Segmente herkömmlich übersetzt, andere jedoch nur post-editiert. Der Unterschied im Vergleich zum gewohnten Workflow ist zwar für die Übersetzer spürbar, aber eine vernünftige Vorübersetzung beschleunigt zugleich die Arbeit der Übersetzer und kompensiert damit die Verschmelzung von Übersetzen und Post-Editing. In Zukunft wird die Maschine jedoch einen noch größeren Einfluss auf die Tätigkeit der Übersetzer haben. Umso verwunderlicher ist es, dass heute keiner unserer SAP-Übersetzer den maschinellen Übersetzer mehr missen möchte.

Zurück zur Frage, was SAP richtig gemacht hat. Zunächst ist die Ausgangslage optimal: SAP wird zu großen Teilen  direkt im SAP-System übersetzt. Dadurch liegen Sprach- und Metadaten am selben Ort. Gemessen an der Vielzahl der Texte, Dokumentationen, UIs und Anleitungen, die über die Jahre entstanden sind, müssen diese Datenmengen immens sein. Zudem hat SAP ein striktes Terminologiemanagement bei gleichbleibendem Sprachstil. Diese Kombination aus Faktoren bildet den optimalen Nährboden für ein gutes NMT-Modell: Hochwertige Trainingsdaten. Genau wie der Mensch muss die Maschine zunächst sprachliche Erfahrungen sammeln, um zum Übersetzer zu werden. Anders als der Mensch kann die Maschine diese sofort umsetzen. Sind die Daten dazu noch hochwertig und auf die Übersetzung zugeschnitten, steht dem digitalen State-of-the-Art Übersetzer nichts mehr im Wege.

Darüber hinaus stammt SAPs NMT-Modell aus artgerechter Haltung, denn die Sprache der Branche eignet sich hervorragend für diese Zwecke. Sie ist geregelt, zweckorientiert, leicht repetitiv und, wenn möglich, knapp formuliert. Für einen MT-Ingenieur sind das die optimalen Laborbedingungen. Und auch wenn es offensichtlich ist: SAPs Texte sind frei von Umgangs- und Alltagssprache. Metaphern, Sarkasmus, Weltwissen, Bridging oder das Genus von Nutella: All diese Stolpersteine bleiben dem Softwaregiganten aus Walldorf erspart.

Natürlich ist nicht alles perfekt. Manche Bereiche, wie z. B. juristische Texte, Lokalisierung und Dev-Talk („Entwicklersprech“), fallen durch die oben genannten Raster und benötigen noch relativ viel menschliche Aufmerksamkeit. Dennoch steht SAPs NMT eine rosige Zukunft bevor. Falls Sie also SAP bisher nicht mit künstlicher Intelligenz und maschineller Übersetzung assoziiert haben, ist es jetzt an der Zeit.

 


Über den Autor:

Daniel Nad, Project Manager at text&formEine geregelte Aneinanderreihung von Lauten, konserviert in abstrakten Zeichenfolgen mit tausenden, untereinander unverständlichen Varianten: Die menschliche Sprache ist faszinierend. Zumindest behauptet das unser Autor Daniel Nad. Als passionierter Sprachwissenschaftler und Mitarbeiter bei text&form erlebt er Sprache direkt – und freut sich, seine Passion mit anderen teilen zu können.