„Computerunterstützte Übersetzung“ – Versionsunterschied

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen
[ungesichtete Version][gesichtete Version]
Inhalt gelöscht Inhalt hinzugefügt
Die letzte Textänderung von 222.67.51.202 wurde verworfen und die Version 99342960 von Kossatsch wiederhergestellt
Zeile 118: Zeile 118:
| proprietär
| proprietär
|-
|-
! style="text-align:left;" |[http://yehongmei.narod.ru/ TM-database]
! style="text-align:left;" |TM-Database
| Java Properties, Microsoft resource RESX, Android resource XML/Smali, PHP sources, MS Office Open XML, Indesign INX, HTML, UNI, Qt TS, XLIFF XLC, Plain Text TXT
| Java Properties, Microsoft resource RESX, Android resource XML/Smali, PHP sources, MS Office Open XML, Indesign INX, HTML, UNI, Qt TS, XLIFF XLC, Plain Text TXT
| Windows
| Windows

Version vom 8. Februar 2012, 08:56 Uhr

Computerunterstützte Übersetzung (engl. computer-aided translation, auch computer-assisted translation, abgekürzt CAT) bezeichnet den Einsatz von Computerprogrammen zur Unterstützung von Übersetzern. CAT darf nicht mit der maschinellen Übersetzung (ohne oder nur mit sehr begrenzter Mitwirkung menschlicher Übersetzer) verwechselt werden.

Besonders bei der Übersetzung technischer Anleitungen in viele verschiedene Sprachen, sog. Software-Lokalisierung, hat sich CAT in Form von Übersetzungsspeicher-Systemen (engl. translation memory system) durchgesetzt. Solche Programme stellen zu übersetzende Texte auf einer zweispaltigen Arbeitsoberfläche dar, speichern die übersetzten Sätze („Segmente“ genannt) in der Ausgangs- und der Zielsprache in der Datenbank (eine einzelne Datei für jede Sprachrichtung), sofern der Übersetzer das bestätigt (bestimmte Texte und Textelemente werden sinnvollerweise nicht gespeichert, z. B. Eigennamen), und vergleichen neue Texte mit ähnlichen oder gleichen Sätzen, die sie als Übersetzungsvorschläge in der zweiten Spalte anzeigen und dabei vermerken, zu wie viel Prozent eine Übereinstimmung mit einem früheren Satz besteht.

Ein häufiges Missverständnis ist, dass die Software „übersetzt“. Dies ist nicht der Fall. Sie speichert Übersetzungseinheiten (Quelltext und Übersetzung) in einer Datenbank. Dann werden neue Quelltexte mit den in der Datenbank vorhandenen Einheiten verglichen und die Übersetzungen von ähnlichen oder gleichen Quelltexten dem Übersetzer angezeigt bzw. vorgeschlagen. Zusätzlich zu den Datenbankvorschlägen aus dem Translation Memory können bei einer bestehenden Internetverbindung in der Programmoberfläche auch externe maschinelle Übersetzungsdienste abgefragt werden. Diese bieten intelligente Übersetzungsalgorithmen, die allerdings von der Qualität einer menschlichen Übersetzung weit entfernt sind. Der Übersetzer kann dann die vorgeschlagenen Übersetzungen verwenden, anpassen oder verwerfen.

Technik

Die Technik beruht auf ausgefeilten linguistischen Algorithmen für den Abgleich neuer Texte mit den Datenbanken, in denen Satzpaare hinterlegt sind. Bei Texten, die zur Übersetzung auf mehrere Übersetzer aufgeteilt sind, gewährleisten sie eine einheitliche Terminologieverwendung im übersetzten Text, bei umfangreichen Terminologiebeständen erleichtern sie den Zugang.

CAT-Systeme bestehen meist aus folgenden Teilsystemen:

  • Translation-Memory-System
  • Terminologie-Datenbank
  • Konvertierprogramme zur Anbindung an Textverarbeitungs- und Desktop-Publishing-Programme
  • Programme zur nachträglichen Erfassung übersetzter Texte (Alignment-Tools), für die man die Übersetzungen in zwei Dateien (Ausgangssprache bzw. Zielsprache) trennen muss. Die Programme segmentieren die Texte (oder übernehmen eine bestehende Tabellenstruktur) und ordnen jedes Segment (in der Regel ein Satz) einem Segment in der Zielsprache zu. Manuell muss diese Zuordnung auf Plausibilität überprüft werden und kann anschließend in den Übersetzungsspeicher eingespeist werden.

Bei diesen Systemen lassen sich zwei Kategorien unterscheiden: Zum einen gibt es dateiorientierte Systeme, in denen einzelne Dateien bearbeitet und in den Datenbanken ausschließlich Übersetzungsspeicher und Terminologiedaten aufbewahrt werden (z. B. MemoQ, SDL Trados, Star Transit, Araya, Wordfast, Anaphraseus, Déjà Vu). Zum anderen gibt es datenbankorientierte Systeme, bei denen die zu übersetzenden Dokumente in eine Datenbank eingelesen werden und die komplette Datenhaltung und weitere Bearbeitung dann in der Datenbank erfolgt (z. B. across, GRIPS, Visual Localize).

Etwa seit 2003 verstärkt sich der Trend zu immer stärker integrierten Systemen. Hier wird neben der reinen Übersetzungsunterstützung zusätzliche Funktionalität für die Projektverwaltung in die Systeme integriert. Diese Systeme werden oft als Client-/Server-Systeme realisiert und dabei so ausgelegt, dass die einzelnen Übersetzer über das Internet auf das Projekt zugreifen können. Dadurch können Übersetzer an quasi beliebigen Standorten auf der Welt an einem Projekt arbeiten, sofern die Infrastruktur und Internetverbindung im jeweiligen Land schnell, stabil und dauerhaft verfügbar ist (z. B. Web Translate It). Ein neuer Ansatz sind vollständig webbasierte Systeme, bei denen keine lokale Installation erforderlich ist, und die dadurch unternehmensweite Zusammenarbeit auf gleichen Datenbeständen für Übersetzung und Freigabe realisieren können.

Programme

Die nachstehende, keinesfalls erschöpfende Liste enthält einige der wichtigsten Programme, die derzeit auf dem Markt sind. Freie Software wird zuerst behandelt.

Programm Unterstützte Dateiformate OS Preis Lizenz
Anaphraseus OpenOffice Writer Extension:
Textdateien, HTML, XHTML, StarOffice, OpenOffice.org, OpenDocument (ODF), MS Word
plattformunabhängig GPL
OmegaT Textdateien, HTML, XHTML, StarOffice, OpenOffice.org, OpenDocument (ODF), MS Office Open XML, Hilfe-Dateien, HTML Help Compiler (HCC), LaTeX, DokuWiki, QuarkXPress CopyFlow Gold, DocBook, Android-Ressourcen, Java Properties, Typo3 LocManager, Mozilla DTD, Windows RC, WiX, ResX, INI-Dateien, XLIFF, Gettext PO, SubRip-Untertitel, SVG-Bilder plattformunabhängig (Java) GPL
Open Language Tools XLIFF, HTML/XHTML, XML, DocBook SGML, ASCII, StarOffice/OpenOffice/ODF, .po (gettext), .properties, .java (ResourceBundle), .msg/.tmsg (catgets) plattformunabhängig (Java) CDDL
Poedit Gettext PO plattformunabhängig MIT
Pootle Gettext PO, XLIFF, OpenOffice GSI-Dateien (.sdf), TMX, TBX, Java Properties, DTD, CSV, HTML, XHTML, Textdateien plattformunabhängig (Python) GPL
Virtaal XLIFF, Gettext PO und MO, TMX, TBX, Wordfast TM, Qt ts
Viele weitere Formate mit dem Translate Toolkit
plattformunabhängig (Python) GPL
Proprietäre Software
across MS Office-Dateien, Adobe FrameMaker, InDesign, QuarkXpress, Quicksilver, TeX-Dateien, DXF, Java. Keine direkte Bearbeitung von ttx- oder XLIFF-Dateien. Windows Einzelplatzversion kostenlos (für registrierte Freiberufler, sonst 980 €) proprietär
AnyMem MS Word Plug-in Windows 89 € (1 Lizenz) proprietär
CafeTran MS Office-Dateien, XLIFF, ttx, sdlxliff, Text, XML, HTML, Abiword, Kword, OpenOffice, iWork, Java (*.properties), Mac (*.strings), Windows NET (*.resx), Adobe Indesign (INX-, IDML-Dateien), Adobe Framemaker (MIF), AutoCAD DXF, DTP (getaggte Textdateien), Bearbeitung von TMX-Dateien plattformunabhängig (Java) 80 € (1 Lizenz) proprietär
Déjà Vu MS Office-Dateien, Microsoft Access , OpenOffice, InDesign, Framemaker, Pagemaker, HTML, Trados TTX, TXML, Ressourcendateien. Windows ab 290 € (eingeschränkte Standardversion) proprietär
Fluency MS Office-Dateien, Publisher, OneNote, OpenOffice, InDesign, Framemaker, PDF, HTML, XML, XLIFF, Help & Manual, Trados TTX, TXML, Ressourcendateien. Windows ab 299 € (verschiedene Lizenzmodelle) proprietär
Heartsome Translation Studio RTF, HTML, XML, DITA, Plain Text, Java Properties, PO, RC/ResX, FrameMaker MIF, SVG, Open Document (OpenOffice.org 2.x) und OpenOffice.org 1.x, Office 2003/2007 XML-Formate, getaggte RTF, Trados TTX (alle Trados-Versionen) und Adobe InDesign CS2/CS3 INX plattformunabhängig (Java) ab 268 € (Editor-Komponente) proprietär
MemoQ MS Office-Dateien, XLIFF, ttx, sdlxliff, Text, XML, HTML, OpenOffice, Java (*.properties), Windows NET (*.resx), Adobe Indesign, Adobe Framemaker, AuthorIT, Typo 3, Visio, Bearbeitung von TMX-Dateien. Kompatibilität zu STAR Transit. Windows, offizielle Unterstützung von Parallels 620 € (1 Lizenz, auf zwei Rechnern nutzbar) proprietär
Metatexis MS Word Plug-in, alle getaggten Dateien Windows 39 € - 139 € (verschiedene Lizenzmodelle) proprietär
SDL Trados MS Office-Dateien, OpenOffice, InDesign, QuarkXPress, PageMaker, Interleaf, Framemaker, HTML, SGML, XML, SVG. Windows 795 € (Freelance-Version) - 4995 € (LSP; Floating-Lizenz) proprietär
TM-Database Java Properties, Microsoft resource RESX, Android resource XML/Smali, PHP sources, MS Office Open XML, Indesign INX, HTML, UNI, Qt TS, XLIFF XLC, Plain Text TXT Windows Frei proprietär
STAR Transit NXT MS Word, MS Excel, MS Powerpoint, Adobe Pagemaker, Text, XML, HTML, Adobe FrameMaker (MIF), RTF, InDesign, QuarkXpress, MS Visio, AutoCad, Interleaf/Quicksilver, alle getaggten Dateien Windows ab 75 € (Freelance-Version für 3 Monate) proprietär
Swordfish Translation Editor MS Office-Dateien, ttx, Text, XML, HTML, Abiword, OpenOffice, Java (*.properties), Windows NET (*.resx), Adobe Indesign, Adobe Framemaker, TXML (Wordfast). plattformunabhängig (Java) 260 € (flexible Lizenz); Rabatt für Studenten proprietär
Wordfast Classic MS Word, Excel, PowerPoint (für Windows und Mac); getaggte Dokumente Microsoft Office Word-Addin

Pro-Version: plattformunabhängig (Java)

500/350 € (für Version Classic und Pro/einzeln); 50 % Rabatt für Übersetzer aus Entwicklungsländern proprietär

Siehe auch