Die vorliegende Bachelorarbeit vergleicht die Übersetzungsergebnisse des Sprachenpaares Englisch - Deutsch von Google translate (SMÜ) und dem Online translator der Firma Systran (RBMÜ). Anhand der Bewertungskriterien von Philipp Koehn, Andreea Calude und des Thomas J. Watson Research Centers wird eine neue Evaluationsmethode hergeleitet. Diese wird auf die Übersetzung eines juristischen Fachtextes (AGB von Facebook) angewendet. Ziel ist es, die Fehler der maschinellen Übersetzungssysteme und die Bereiche, in denen konkreter Verbesserungsbedarf besteht, aufzuzeigen. Letztlich werden beide Systeme gegenübergestellt, um die Ergebnisse direkt miteinander zu vergleichen.
Inhaltsverzeichnis
- 1. Einleitung
- 2. Die Geschichte der Maschinenübersetzung
- 3. Ziel der Maschinenübersetzung
- 4. Arten der maschinellen Übersetzung
- 5. Ansätze der maschinellen Übersetzung
- 5.1 Regelbasierte Ansätze
- 5.1.1 Direkte Systeme
- 5.1.2 Indirekte Systeme
- 5.1.2.1 Interlingua Systeme
- 5.1.2.2 Transfersysteme
- 5.2 Korpusbasierte Systeme
- 5.2.1 Beispielbasierte maschinelle Übersetzung
- 5.2.2 Statistisch maschinelle Übersetzung
- 5.3 Hybridsysteme
- 5.4 Weitere Ansätze
- 5.1 Regelbasierte Ansätze
- 6. Auswahl der maschinellen Übersetzungssysteme
- 7. Auswahl des Textes
- 8. Evaluation des Textes
- 8.1 Evaluation nach dem Thomas J. Watson Research Center
- 8.2 Evaluation nach Koehn
- 8.3 Evaluation nach Calude
- 8.4 Kombinierte Evaluation
- 9. Analyse und Fehlerauswertung
- 9.1 Google translate
- 9.1.1 Der Sprachfluss
- 9.1.2 Adäquater Ausdruck
- 9.2 Systran Online-translator
- 9.2.1 Der Sprachfluss
- 9.2.2 Adäquater Ausdruck
- 9.3 Die Ergebnisse im Vergleich
- 9.1 Google translate
- 10. Fazit und Zukunftsprognose
Zielsetzung und Themenschwerpunkte
Diese Arbeit vergleicht zwei gängige Methoden der maschinellen Übersetzung (MÜ): die statistische MÜ (SMÜ) und die regelbasierte MÜ (RBMÜ). Die Zielsetzung besteht darin, anhand eines juristischen Fachtextes die qualitative Überlegenheit eines Systems zu ermitteln und den aktuellen Stand der Systeme Google Translate (SMÜ) und Systran (RBMÜ) für die Sprachrichtung Englisch-Deutsch zu dokumentieren. Der Fokus liegt auf der direkten Übersetzung, um den Nachbearbeitungsaufwand für den menschlichen Übersetzer zu bewerten.
- Vergleich von SMÜ und RBMÜ
- Evaluierung der Übersetzungsgüte von Google Translate und Systran
- Analyse von Fehlern in maschinellen Übersetzungen
- Bewertung des Einflusses der Datenmenge auf die Qualität statistischer Übersetzungen
- Bestimmung des optimalen Systems für juristische Fachtexte
Zusammenfassung der Kapitel
1. Einleitung: Die Einleitung beschreibt den stetigen Fortschritt im Übersetzungsbereich, von traditionellen Methoden bis hin zur modernen maschinellen Übersetzung (MÜ). Sie betont die Rolle der MÜ als Werkzeug für Übersetzer und nicht als vollständigen Ersatz. Der Fokus der Arbeit wird auf den Vergleich zwischen statistischer MÜ (SMÜ) und regelbasierter MÜ (RBMÜ) gelegt, wobei Google Translate und Systran als jeweilige Vertreter dienen. Die Arbeit untersucht die Qualität der Übersetzungen anhand eines juristischen Fachtextes und dokumentiert den aktuellen Stand der ausgewählten Systeme für die Sprachrichtung Englisch-Deutsch. Die Bedeutung der direkten Übersetzung und der Reduzierung des Nachbearbeitungsaufwands wird hervorgehoben.
2. Die Geschichte der Maschinenübersetzung: Dieses Kapitel würde die historische Entwicklung der maschinellen Übersetzung beleuchten, von den frühen Ansätzen bis zu den modernen Systemen. Es würde wichtige Meilensteine und Entwicklungen hervorheben, einschließlich der Herausforderungen und Durchbrüche im Laufe der Zeit. Die Entwicklung von regelbasierten und statistischen Ansätzen könnte detailliert dargestellt werden, zusammen mit den wichtigsten Einflussfaktoren auf die Fortschritte im Bereich der MÜ. Der Einfluss von technologischen Entwicklungen und der wachsenden Verfügbarkeit von Daten auf die Entwicklung der MÜ wäre ein weiterer wichtiger Aspekt.
3. Ziel der Maschinenübersetzung: Dieses Kapitel würde das grundlegende Ziel der maschinellen Übersetzung definieren. Es würde verschiedene Ansätze diskutieren, z. B. die vollständige Automatisierung, die Unterstützung von menschlichen Übersetzern, und die verschiedenen Anwendungen der MÜ in verschiedenen Kontexten und Branchen. Es würde außerdem die verschiedenen Herausforderungen diskutieren, die mit dem Erreichen des Ziels einer hochwertigen und effizienten maschinellen Übersetzung einhergehen.
4. Arten der maschinellen Übersetzung: Dieses Kapitel beschreibt die verschiedenen Arten der maschinellen Übersetzung. Es würde die Unterscheidung zwischen verschiedenen Kategorien, wie z.B. voll automatische, human-unterstützte und maschinen-unterstützte Übersetzung, detailliert erläutern. Die jeweilige Stärke und Schwäche der verschiedenen Arten würde erläutert, und es würde dargelegt werden, wie sich die verschiedenen Arten in der Praxis unterscheiden.
5. Ansätze der maschinellen Übersetzung: Dieses Kapitel bietet eine detaillierte Übersicht über verschiedene Ansätze zur maschinellen Übersetzung. Es würde regelbasierte, korpusbasierte (beispielbasiert und statistisch) und hybride Ansätze untersuchen und ihre jeweiligen Vor- und Nachteile, Stärken und Schwächen diskutieren. Der Fokus liegt auf den Unterschieden im Übersetzungsprozess und den daraus resultierenden Ergebnissen. Es würde konkrete Beispiele für jeden Ansatz bieten, um die theoretischen Konzepte zu veranschaulichen. Die Kapitel 5.1-5.4 würden diese Ansätze detailliert erläutern, ihre Funktionsweise beschreiben und ihre Anwendung in der Praxis illustrieren.
6. Auswahl der maschinellen Übersetzungssysteme: In diesem Kapitel wird die Auswahl der beiden für den Vergleich verwendeten Systeme, Google Translate (als Vertreter der SMÜ) und Systran (als Vertreter der RBMÜ), begründet. Es werden die Kriterien für die Auswahl erläutert und die spezifischen Eigenschaften der beiden Systeme im Kontext der Studie beschrieben. Die Entscheidung für diese beiden Systeme wird im Detail erläutert, einschließlich der Betrachtung alternativer Optionen und der Rechtfertigung der getroffenen Wahl. Die Eignung der gewählten Systeme für den Übersetzungstest wird dargelegt.
7. Auswahl des Textes: Dieses Kapitel beschreibt den Prozess der Auswahl des juristischen Fachtextes, der für die Evaluierung der beiden MÜ-Systeme verwendet wird. Es wird die Begründung für die Auswahl eines solchen Textes liefern und die Kriterien erläutern, die bei der Auswahl des Textes berücksichtigt wurden. Die Repräsentativität des ausgewählten Textes im Hinblick auf die Komplexität und sprachliche Merkmale juristischer Fachsprache wird beleuchtet. Die Bedeutung der Textauswahl für die Validität der Studie wird betont.
8. Evaluation des Textes: Dieses Kapitel beschreibt die Methodik der Evaluation der Übersetzungen. Es werden die verschiedenen Bewertungsmethoden detailliert erläutert, z.B. die Methoden von Watson, Koehn und Calude, die als Grundlage für die quantitative und qualitative Analyse der Übersetzungen dienen. Das Kapitel erläutert, wie diese Methoden angewendet wurden und welche spezifischen Metriken zur Beurteilung der Übersetzungsgüte herangezogen wurden. Die Wahl der konkreten Bewertungsmethoden wird detailliert begründet, und ihre Stärken und Schwächen werden kritisch bewertet.
Schlüsselwörter
Maschinelle Übersetzung (MÜ), Statistische MÜ (SMÜ), Regelbasierte MÜ (RBMÜ), Google Translate, Systran, Übersetzungsgüte, Fehleranalyse, Sprachfluss, Adäquater Ausdruck, juristische Fachsprache, Englisch-Deutsch Übersetzung.
Häufig gestellte Fragen (FAQ) zur Arbeit: Vergleich statistischer und regelbasierter Maschinenübersetzung
Was ist der Gegenstand dieser Arbeit?
Diese Arbeit vergleicht zwei gängige Methoden der maschinellen Übersetzung (MÜ): die statistische MÜ (SMÜ) und die regelbasierte MÜ (RBMÜ). Konkret werden die Systeme Google Translate (als Vertreter der SMÜ) und Systran (als Vertreter der RBMÜ) anhand eines juristischen Fachtextes in der Sprachrichtung Englisch-Deutsch evaluiert. Der Fokus liegt auf der direkten Übersetzung und der Bewertung des Nachbearbeitungsaufwands.
Welche Systeme wurden verglichen?
Die Arbeit vergleicht Google Translate (ein Beispiel für statistische Maschinenübersetzung) und Systran (ein Beispiel für regelbasierte Maschinenübersetzung).
Welche Art von Text wurde für den Vergleich verwendet?
Für die Evaluation wurde ein juristischer Fachtext verwendet, um die Leistung der Systeme in einem spezifischen und anspruchsvollen Kontext zu testen.
Welche Kriterien wurden zur Bewertung der Übersetzungsgüte verwendet?
Die Bewertung der Übersetzungen erfolgte anhand verschiedener Kriterien, darunter die Methoden von Watson, Koehn und Calude. Es wurden sowohl quantitative als auch qualitative Aspekte der Übersetzungen, wie Sprachfluss und adäquater Ausdruck, berücksichtigt. Die Kapitel 8 und 9 gehen detailliert auf die Evaluationsmethoden und die Ergebnisse ein.
Welche Aspekte der Übersetzungen wurden analysiert?
Die Analyse umfasste die Bewertung des Sprachflusses und des adäquaten Ausdrucks der Übersetzungen. Es wurde auch eine detaillierte Fehleranalyse durchgeführt, um die Stärken und Schwächen der beiden Systeme zu identifizieren.
Welche Ziele wurden mit dieser Arbeit verfolgt?
Die Arbeit zielt darauf ab, die qualitative Überlegenheit eines der beiden Übersetzungssysteme zu ermitteln und den aktuellen Stand der Systeme Google Translate und Systran für die Übersetzung juristischer Fachtexte von Englisch nach Deutsch zu dokumentieren. Ein weiteres Ziel ist die Bewertung des Einflusses der Datenmenge auf die Qualität statistischer Übersetzungen.
Welche Kapitel umfasst die Arbeit und worum geht es jeweils?
Die Arbeit ist in 10 Kapitel gegliedert, beginnend mit einer Einleitung und einem Überblick über die Geschichte der Maschinenübersetzung. Es folgen Kapitel zu den Zielen der MÜ, den verschiedenen Arten und Ansätzen der MÜ (regelbasiert, korpusbasiert, hybrid), der Auswahl der Systeme und des Textes, der Evaluation der Übersetzungen, der Fehleranalyse und abschließend einem Fazit und Zukunftsprognose. Eine detaillierte Zusammenfassung jedes Kapitels befindet sich im Abschnitt "Zusammenfassung der Kapitel".
Welche Schlüsselwörter beschreiben die Arbeit?
Schlüsselwörter sind: Maschinelle Übersetzung (MÜ), Statistische MÜ (SMÜ), Regelbasierte MÜ (RBMÜ), Google Translate, Systran, Übersetzungsgüte, Fehleranalyse, Sprachfluss, Adäquater Ausdruck, juristische Fachsprache, Englisch-Deutsch Übersetzung.
Welche Schlussfolgerungen wurden gezogen?
(Diese Frage kann erst beantwortet werden, wenn die vollständige Arbeit vorliegt und das Kapitel "Fazit und Zukunftsprognose" ausgewertet wurde.)
Wo finde ich mehr Informationen?
(Hier könnte ein Link zum vollständigen Dokument eingefügt werden, falls verfügbar.)
- Quote paper
- Julien Appler (Author), 2016, Linguistischer Vergleich statischer und regelbasierter maschineller Übersetzung. "Google translate" gegen den "Systran Onlinetranslator", Munich, GRIN Verlag, https://www.grin.com/document/352622