Blog

Maschinelle Übersetzung für technische Dokumentation nutzen – aber wie?

  • MILENGO
Maschinelle Übersetzung für technische Dokumentation nutzen – aber wie?

Automatische Übersetzungstools sind in der Arbeitswelt längst gang und gäbe. Sie wollen sich über den Inhalt eines chinesischen Fachartikels informieren? Oder die E-Mail-Korrespondenz Ihrer portugiesischen Kollegen nachvollziehen? Ein paar Klicks, und schon ist die Sprachbarriere überwunden.

Anders sieht die Sache aus, wenn Softwareunternehmen maschinelle Übersetzung (MT) zur Erreichung einer professionellen Textqualität einsetzen wollen – etwa für Softwaredoku oder UI. Hier stoßen populäre Gratisdienste wie Google Translate schnell an ihre Grenzen. Wie also wird MT zu einem echten Produktivitätstool? Milengo verschafft einen Überblick.

Wahl des Anbieters

Der Markt

Heutige MT-Systeme für die geschäftliche Anwendung werden als Abonnementdienst in der Cloud angeboten. Das Feld führen die großen Tech-Konzerne an: Amazon Web Services, Google, Microsoft und IBM. In unseren Breitengraden gesellt sich dazu noch das Kölner Unternehmen DeepL. Hinzu kommen regionale Anbieter wie Yandex für das Russische oder Baidu für Chinesisch.

Für Unternehmenskunden wird eine kostenpflichtige Serviceoption angeboten, die den Schutz Ihrer Unternehmensdaten gewährleistet und eine REST API zur Anbindung des Systems an Ihre interne Software bereitstellt.

Die Qualität

Prinzipiell gilt: Mit den oben genannten Anbietern machen Sie nichts falsch – die Qualitätsunterschiede sind gering, auch die Preismodelle unterscheiden sich nur marginal. Google liefert als Marktführer in den Bereichen Deep Learning und künstliche Intelligenz sprachenübergreifend mit die zuverlässigsten Ergebnisse, während DeepL durch den Rückgriff auf ein besonders ausgereiftes Convolutional Neural Network besonders flüssige Texte produziert.

Beachten Sie auch, dass die Qualität nicht nur nach Anbieter, sondern auch nach Sprachkombination variieren kann. Nicht in jedem Fall kommt die modernste Technologie – neuronale maschinelle Übersetzung (NMT) – zum Einsatz; für einige Sprachen werden noch ältere statistische Übersetzungsverfahren herangezogen.

Machen Sie selbst die Probe aufs Exempel

Aus den Marketingversprechen der Anbieter („nahezu menschliche Übersetzungsqualität“) können Sie keine verlässlichen Rückschlüsse darauf ziehen, ob die Maschine beispielsweise auch bei der Softwaredokumentation Ihres Unternehmens gute Ergebnisse liefert. Testen Sie deshalb den Output selbst – und damit ist nicht gemeint, probeweise ein paar Sätze in Google oder DeepL einzugeben. Ziehen Sie vielmehr einen aussagekräftigen Mustertext (ca. 1.000–2.000 Wörter) heran, der repräsentativ für die von Ihnen gewünschte Textsorte und das benötigte Fachgebiet ist. Anschließend sollten Experten wie technische Redakteure oder Fachübersetzer die Qualität eingehend beurteilen – denn nicht selten klingen maschinelle Übersetzungen heutzutage auf den ersten Blick flüssig und vertrauenseinflößend, während sich auf den zweiten Blick schwere inhaltliche Fehler oder falsche Bezüge offenbaren.

Verarbeitung von Übersetzungsdateien

Website-Content oder UI-Strings sind in der Regel kein schöner Fließtext in einer Word-Datei, der sich bequem per Copy & Paste in ein maschinelles Übersetzungstool übertragen lässt. Bei komplexeren Dokumenttypen wie XML oder PowerPoint hat die Formatierung einen erheblichen Einfluss auf die Qualität des MT-Outputs.

Folgende Probleme können beispielsweise durch eine MT-Vorübersetzung in der Zieldatei auftreten:

  • Die Übersetzung beginnt aufgrund fehlerhafter Zeilenumbrüche mitten im Satz neu
  • Vor Satzzeichen (. , ? !) werden zusätzliche Leerzeichen eingefügt
  • Die Dokumentformatierung wird beschädigt
  • Markup Language im Quellcode des Dokuments wird beschädigt
  • Zentrale Begriffe werden fälschlicherweise übersetzt – etwa der Name Ihres Unternehmen

Derartige Ungereimtheiten führen zu höheren Übersetzungskosten, da beim Post-Editing mehr Textanpassungen vorgenommen werden müssen. Um das zu vermeiden, sind ausgereifte Prozesse in der Vor- und Nachbereitung von Übersetzungsdateien nötig, die fundiertes Wissen über Dateiformate und ihr Verhalten erfordern.

Von Customization profitieren

Die Basissysteme der MT-Provider sind nicht auf Ihre Unternehmensanforderungen zugeschnitten. Sie übersetzen, salopp gesagt, Kochrezepte, Gedichte und Ihre Softwaredokumentation mit denselben Ressourcen. Dementsprechend unscharf wird unter Umständen Ihre Firmensprache wiedergegeben.

Für maximale Effizienz muss ein MT-System deshalb für einen bestimmten Einsatzzweck trainiert werden. Hierfür werden sogenannte Customization-Services angeboten. Diese Option kommt für Sie aber nur infrage, wenn Ihr Unternehmen bereits über genügend Übersetzungsdaten verfügt – optimalerweise sollten Sie in der Lage sein, mindestens 20.000 hochwertige Translation-Memory-Segmente bereitzustellen.

Post-Editing in CAT-Tools

Trotz des rasanten technologischen Fortschritts sind maschinell übersetzte Texte weiterhin fehleranfällig. Im Softwarekontext können sie Verständnisprobleme verursachen oder schlimmstenfalls Kunden in die Irre führen. Um die Qualität zu sichern, sollte MT-Output deshalb auch weiterhin durch einen durch einen erfahrenen Editor nachbearbeitet werden, der mit dem Fachgebiet und der Ausgangssprache vertraut ist und und über eine hohe sprachliche Kompetenz in der Zielsprache verfügt.

Dieses „Post-Editing” erfolgt in der Regel in CAT-Tools, die heute allesamt über eigene Plugins für ausgewählte MT-Systeme verfügen. Damit kann die Vorübersetzung direkt im Übersetzungstool erfolgen. Etwas problematisch dabei ist, dass die zugrundeliegenden Schnittstellen häufig noch nicht besonders ausgereift sind. So werden beispielsweise Formatierung und Sonderzeichen im Ausgangsdokument fehlerhaft erkannt, was gerade bei komplizierteren Dateiformaten zu einem qualitativ schlechteren Output führen kann. Wer auf Nummer sicher gehen möchte, verzichtet deshalb möglichst auf derartige Plugins. Stattdessen empfiehlt es sich, den Content extern vorzuübersetzen und selbst in das Tool einzubinden. Für dieses Verfahren wird jedoch fundiertes Wissen über Softwarelokalisierung benötigt.

Fazit

Maschinelle Übersetzungsdienste sind heute über die Cloud bequem und universell verfügbar. Eine optimale Qualität und maximale Produktivität erreichen Sie aber nur mit professionellem Pre- und Postprocessing der Übersetzungsdateien sowie einer passgenauen Anbindung der MT-Systeme an Ihre Workflows.

  • MILENGO