Die Arbeit wird im Rahmen des Seminars Copmuterlinguisitik angefertigt und beschäftigt sich mit der Untersuchung der Fehler eines Textes, die bei der maschinellen Übersetzung von Google Translate auftreten. Der ausgewählte Text ist ein literarischer Text von Franz Kafka und trägt den Titel "Die Verwandlung". Im ersten Kapitel des Hauptteils werden die theoretischen Grundlagen der Computerlinguistik dargelegt. Die Computerlinguistik ist ein neuer Bereich der Linguistik. In diesem Kapitel werden die Rolle und die Anwendungsgebiete der Computerlinguistik näher erklärt. Im zweiten Kapitel sollen die Ereignisse der maschinellen Übersetzung erläutert werden und die wichtigsten Voraussetzungen für den maschinellen Übersetzungsvorgang hervorgehoben.
Weiterhin wird die Struktur eines automatischen Übersetzungssystems behandelt und dabei auch die drei Grundphasen analysiert, die für den maschinellen Übersetzungsvorgang wichtig sind. Am Ende des zweiten Kapitels des Hauptteils wird das Google Translate Übersetzungssystem dargestellt, denn durch dieses System soll das literarische Werk übersetzt werden. Im letzten Kapitel des Hauptteils findet die Fehleranalyse statt. Ein Teil des literarischen Werkes wird vom Google Translate übersetzt werden und die Fehler, die sich ergeben, werden näher untersucht und im linguistischen Bereich, zu dem sie gehören, eingeordnet. Am Ende wird diskutiert, ob Google Translate eine gelungene Übersetzung ergeben hat und welche Übersetzungsschwierigkeiten erscheinen.
Inhaltsverzeichnis
1. Einleitung
2. Theoretische Grundlagen
2.1 Der Teilbereich der Computerlinguistik
2.2 Die Anwendungsbereiche der Computerlinguistik
2.2.1 Die gemeinsame Anwendungsbereiche der Computerlinguistik und der Linguistik
3. Maschinelle Übersetzung
3.1 Voraussetzungen für die maschinelle Übersetzung
3.2 Das System der maschinellen Übersetzung
3.3 Google Translate
3.4 Textsorte
4. Die maschinelle Übersetzung und die Übersetzungsschwierigkeiten
4.1 Korpus
4.2 Fehleranalyse
4.3 Ergebnisse
5. Schlussfolgerung
6. Nachwort
7. Literaturverzeichnis
1. Einleitung
Die vorliegende Hausarbeit wird im Rahmen des Seminars Copmuterlinguisitik angefertigt und beschaftigt sich mit der Untersuchung der Fehler eines Textes, die bei der maschinellen Übersetzung von Google Translate auftreten. Der ausgewahlte Text ist ein literarischer Text von Franz Kafka und tragt den Titel “Die Verwandlung” Im ersten Kapitel des Hauptteils werden die theoretischen Grundlagen der Computerlinguistik dargelegt. Die Computerlinguistik ist ein relativ neuer Bereich der Linguistik. In diesem Kapitel werden die Rolle und die Anwendungsgebiete der Computerlinguistik naher erklart. Im zweiten Kapitel sollen die Ereignisse der maschinellen Übersetzung elautert werden und die wichtigsten Voraussetzungen für den maschinellen Übersetzungsvorgang hervorgehoben. Weiterhin wird die Struktur eines automatischen Übersetzungssystems behandelt und dabei auch die drei Grundphasen analysiert, die für den maschinellen Übersetzungsvorgang wichtig sind. Am Ende des zweiten Kapitels des Hauptteils wird das Google Translate Übersetzungssystem dargestellt, denn durch dieses System soll das literarische Werk übersetzt werden.
Im letzten Kapitel des Hauptteils findet die Fehleranalyse statt. Ein Teil des literarischen Werkes wird vom Google Translate übersetzt werden und die Fehler, die sich ergeben, werden naher untersucht und im linguistischen Bereich, zu dem sie gehören, eingeordnet. Am Ende wird diskutiert, ob Google Translate eine gelundene Übersetzung ergeben hat und welche Übersetzungsschwierigkeiten erscheinen.
2. Theoretische Grundlagen
2.1 Der Teilbereich der Computerlinguistik
Die Compterlinguistik ist eine Disziplin, die im 80er Jahre entstanden ist und schon zehn Jahre spater, im 90er Jahre, eine groBe Entwicklung kennengelernt. Am Anfang war der Computer ein Werkzeug für die Informatiker, aber wegen den groBen Bedürfnissen des Zeitalters fingen immer mehr Unternehmen und Organisationen an ihn zu benutzen. Nicht nur im wissenschaltlichen Bereich, sondern auch im privaten Leben anwedeten die Menschen den Computer, um Texte zu lesen, Videos anzuschauen usw. Die zunehmende Zahl der Anwendungsbereiche führte zu einer groBen Herausforderung: Der Computer sollte die natürliche Sprache verstehen und verwenden, denn die Sprache gilt “als Mittel der Kommunikation zwischen den Menschen und den Computer” (Alexandris, 2011: 9).
Aus diesen Gründen ist das Gebiet der Computerlinguistik entwickelt, das den Bereich der Künstlichen Intelligenz mit der theoretischen Sprachwissenschaft kombiniert und Modellen aus der Linguistik und der Informatik anwendet (vgl. Hahn, 2001). In der Computerlinguistik ist eine maschinelle Verarbeitung, von natürlichen Sprachen durchgeführt. Die Verarbeitung von Texten betrifft sich sowohl auf geschriebenen Texten als auch auf gesprochenen Texten (CIS Computer linguistic). Damit dieser Vorgang gelingt soll der Computer die natürliche Sprache verstehen und beartbeiten können. Das bedeutet, dass die Modelle in Form von Regeln umgesetzt werden (vgl. Alexandris, 2011: 10).
2.2 Die Anwendungsbereiche der Computerlinguistik
Die Computerlinguistik wird in verschiedenen Bereichen verwendet. Sehr bekannt ist der Bereich der maschinellen Übersetzung. Die maschinelle Übersetzung schlieBt sowohl Texte der geschriebener oder gesprochener Sprache ein als auch Frage- Antwort-Systeme und Dialogsysteme. Die Computerlinguistik bezüglich der gesprochenen Sprache ist sehr nützlich besonders für Behinderte, Blinde oder Schwerhörige Menschen. Die Sprache wird durch ein System erkannt und dadurch kann man Ferngesprache führen oder weitere Leistungen schaffen (Alexandris, 2011:11). Was den Dialogsystemen der gesprochener Sprache betrifft, sie sind sehr wichtig für die Kommunikation der Raumfahrer bei einer Raumfahrt (Shriberg et al., 2003).
2.2.1 Die gemeinsame Anwendungsbereiche der Computerlinguistik und der Linguistik
Wie bereits oben schon erwahnt wurde verwendet die Computerlinguistik die Modelle der Sprachwissenschaft. Das bedeutet, dass die Bereiche der Linguistik, und zwar der Morphologie, der Lexikologie, der Syntax und der Sematik werden gleichzeitig bei allen Bereichen der Computerlinguistik angewendet. Der Bereich der Textlinguistik wird nur bei Textverstehende und - erzeugende Systeme oder automatische Textverfassung angewendet, die Pragmatik und Soziolinguistik bei Frage-Antwort- Systeme und Dialogsysteme (geschriebener und gesprochener Sprache) und, zuletzt, die Phonetik - Phonologie wird im Bereich der Erkennung gesprochener Sprache, Frage-Antwort-Systeme, Dialogsysteme und maschinelle Übersetzung gesprochener Sprache angewendet (vgl. Alexandris, 2011).
3. Maschinelle Übersetzung
Mit dem Begriff der maschinellen Übersetzung ist eine automatisierte Übersetzung gemeint. Das bedeutet, dass die Übersetzung ohne die menschliche Interaktion durchgeführt wird. Dieser Vorgang ist besonders anspruchsvoll, denn das System soll morphosyntaktische, semantische oder auch pragmatische Regeln von mehr als eine Sprache verwenden (Alexandris, 2011). Das System der maschinellen Übersetzung kann entweder für spezifische Textsorten oder für verschiedenen Textsorten angewendet werden. Die Systeme, die verschiedene Textsorten bearbeiten, sind unter den Namen “Allround” Systems bekannt. Noch ist die maschinelle Übersetzung entweder nur für gesprochenen oder nur für geschriebenen Texten geeignet. Manchmal auch für Videos.
3.1 Voraussetzungen für die maschinelle Übersetzung
Nach Hahn (2001) ist eine maschinelle Übersetzung möglich, wenn der Text in schriftlicher Form ist, wenn er ‘domanabhangig' ist, wenn er einfach ist, wenn er eine klare Struktur hat und wenn man für den Übersetzungsvorgang einen Korpus hat. Das bedeutet, dass man einen schriftlichen Text in elektronischer Form vorhanden haben soll. Das gilt sowohl für geschriebene Texte als auch für gesprochene Texte. Was im zweiten Fall passiert wird durch folgendes Beispiel erklart: Die gesprochene Texte werden zuerst von Systemen anerkannt, die speziell für Spracherkennung geeignet sind (Speech Recognition Systems). Diese Systeme erkennen die Signale der Stimme und wandeln sie mit Hilfe von phonologischen Regeln in Buchstaben und danach in Wörtern um. Erwahnenswert ist, dass der Text keine Fehler enthalten soll im Bereich der Orthographie oder Interpunktion, sonst wird er falsch übersetzt werden. Was man noch darauf achten sollte ist, dass der Text eine klare und einfache Struktur hat. Es ist leichter einen Text zu übersetzen, wenn er eine einfache morphosyntaktische und pragmatische Struktur hat. Zu den Grundvoraussetzungen gehört die Domanabhangigkeit. Das heiBt, wenn sich ein Text auf einen bestimmten Bereich betrifft, dann wird er leichter bearbeitet und erfolgreich übersetzt.
3.2 Das System der maschinellen Übersetzung
In einer maschinellen Übersetzung gibt es grundsatzlich drei Phasen. Die Analyse, den Transfer und die Generation. Im Vorgang der Analyse wird der Text in kleineren Einheiten analysiert. Diese erste Phase benutzt morphosyntaktische und semantische Regeln, manchmal auch pragmatische Regeln, damit die Bearbeitung gelingt. Die zweite Phase, des Transfers, kombiniert die morphosyntaktische oder auch semantische Ereignisse der Ausgangssprache bzw. Quellsprache mit den Aquivalenten der Zielsprache. In der Generierungsphase werden, aus den morphosyntaktischen und semantischen Ereignisse der Zielsprache, Satze gebildet.
Der folgende Diagramm stellt die Phasen des maschinellen Übersetzungssystems dar.
Quellsprache
Abbildung in dieser Leseprobe nicht enthalten
3.3 Google Translate
Google Translate, auf Deutsch Google Übersetzter, ist ein System maschineller Übersetzung, das seit 2006 existiert. Diese Dienstleistung, die von Google angeboten worden ist, hat die Fahigkeit Wörter, Satze und Texte auf über hundert Sprachen zu übersetzen. Das System hat in den letzten Jahren eine groBe Entwicklung kennengelernt. Haufig werden Wörter nicht direkt von einer Sprache in einer anderen übersetzt, sodass dieser neue Ansatz zu einem Ergebnis führt, das eher der Art und Weise entspricht, wie Menschen tatsachlich kommunizieren (Walter, 2016). Der Google Translate bietet sowohl eine direkte Übersetzung (dirketes System) als auch ein Transferansatz (Transfer-System). In den folgenden Kapitel wird erklart wie Google Translate eine gelungene Übersetzung ergibt und welche Übersetzungsschwierigkeiten auftreten.
3.4 Textsorte
Der Text, der folgend bearbeitet wird, ist ein literarisches Werk von Franz Kafka und hat den Titel „Die Verwandlung“. Konkret wird ein Abschnitt vom ersten Kapitel von diesem Werk bearbeitet. Die Verwandlung ist eine Erzahlung, die im Jahr 1916 erschien. Kafka benutzt in seinen Werken eine einfache Sprache und das ist eine Grundvoraussetzung für eine gelungene Übersetzung. In diesem ersten Abschnitt wird die Verwandlung beschrieben, und zwar der Protagoniste Gregor Samsa, der zu einem Insekt verwandelt worden ist, zu einem Kafer. Gregor ist verschlafen, und die erste Sache an der er denkt, wenn er aufwacht, ist seine Arbeit, denn seine Familie ist von seinem Einkommen abhangig.
Es handelt sich um ein literarisches Werk. Das bedeutet, dass man eine Textsorte verfügen. Nach Stolz, sollte man darauf achten, wenn man ein literari sches Werk übersetzt, dass es in der Zielsprache so wie in der Quellsprache wirkt (vgl. Stolze, 1992). „Die Aufgabe der Übersetzer besteht also pragmatisch darin, das Unbestimmte, Offene, Polyvalente im Originaltext für die Deutungserfahrung des Lesers der Übersetzung zu bewahren” (Stolze, 1992:226). Deshalb soll man darauf achten, dass über Google Translate die Wörter richtig übersetzt werden und die Sprache nicht vereinfacht wird.
4. Die maschinelle Übersetzung und die Übersetzungsschwierigkeiten
Im folgenden Kapitel wird ein Teil des Werkes von Kafka “die Verwandlung”, aus dem ersten Kapitel, von Google Translate übersetzt und danach werden die Übersetzungsschwierigkeiten diskutiert.
Die wichtigsten Fehler lassen sich in zwei Bereichen kategorisieren. Erstens, im morphosyntaktischen Bereich, in dem man die grammatische Struktur überprüft oder die richtige Reihenfolge der Wörter, wie z.B. die Position des Verbs (vgl. Alexandris, 2011). Zweitens, im lexikalischen Bereich gibt es Wörter, die mehrere als eine Bedeutungen tragen, wie z. B. das Wort Muster, das im Griechischen als oxéöio, öst/liu oder npÓTuno übersetzt werden kann. Diese Wörter heiBen Polyseme (Alexandris, 2011).
Im weiteren wird auch über Fehler diskutiert die anhand von Phraseologismen entstehen.
4.1 Korpus
Abbildung in dieser Leseprobe nicht enthalten
[...]
- Citar trabajo
- Vasiliki Aspriadou (Autor), 2019, Maschinelle Übersetzung mit Google Translate. Fehleranalyse am Beispiel von "Die Verwandlung" (Franz Kafka), Múnich, GRIN Verlag, https://www.grin.com/document/901582
-
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X.