Das Ziel dieser Arbeit ist, eine Einführung in die Korpuslinguistik zu geben und wichtige Begriffe zu erklären. Am Anfang der Seminararbeit werden Methoden der Sprachwissenschaft genannt, die zur Analyse der Sprache notwendig sind. Darauf folgt die Definition des Begriffes "Korpus". Anschließend werden sowohl der Aufbau eines Korpus, die Verwendungsgebiete und Arten von Korpora, als auch Verfahren zur Analyse von Korpusdaten, sowie einige Beispiele für Suchtools vorgestellt und näher beschrieben.
Korpuslinguistische Methoden gehören mittlerweile zum Standardrepertoire der sprachwissenschaftlichen Forscherinnen und Forscher. Bereits im neunzehnten Jahrhundert und früher wurden Textsammlungen zur Untersuchung des Sprachwandels sowie der Belegung von grammatikalischen Aussagen dokumentiert und analysiert. Diese galten auch als Vergleichsmaterial und zur Illustration vom Sprachgebrauch in Fremdsprachen. In der Korpuslinguistik wird unter anderem die deutsche Sprache in ihren verschiedenen Erscheinungsformen beziehungsweise ihrem Gebrauch untersucht. Dabei werden mittels verschiedener Korpora Hypothesen oder neue Erkenntnisse erstellt.
Bei der Untersuchung des Sprachgebrauchs kann man verschiedene Methoden heranziehen. Da für die Datenanalyse technisches Know-how notwendig ist, liegt Korpuslinguistik folglich an der Schnittstelle zwischen Philologie und Informationstechnologie. Doch worauf muss man bei einer Analyse von Korpusdaten achten? Wie trifft man die geeignete Wahl eines Korpus für linguistische Recherchen? Welche Typen von Daten können in welchen Korpora untersucht werden?
Inhaltsverzeichnis
- Einleitung
- Methoden der Sprachwissenschaften
- Was ist ein Korpus?
- Wie ist ein Korpus aufgebaut?
- Repräsentativität
- Beständigkeit
- Korpusgröße
- Textproben
- Inhalt
- Metadaten
- Wofür werden Korpora verwendet?
- Erforschung von sprachlichen Strukturen und Varietäten
- Fremdsprachenunterricht und Übersetzung
- Erstellung von Wörterbüchern (Lexikografie)
- Erstellung von Grammatiken (Grammatikografie)
- Computerlinguistik
- Welche Arten von Korpora gibt es?
- Computerlesbare Korpora und nicht-computerlesbare Korpora
- Gesamtkorpus und Teilkorpus
- Volltextkorpus und Probenkorpus
- Statische Korpora und Monitorkorpora
- Annotierte Korpora und nicht-annotierte Korpora
- Korpus der geschriebenen Sprache und der gesprochenen Sprache
- Korpora der Gegenwartssprache und historische Korpora
- Referenzkorpora und Spezialkorpora
- Einsprachige und mehrsprachige Korpora
- Verfahren zur Analyse von Korpusdaten
- Stichwortsuche
- Konkordanzen
- Kollokationsanalyse
- Wortlisten
- Welche Suchtools gibt es?
- World Wide Web als Korpus
- Die Korpora des DWDS
- COSMAS II
- Das TIGER-Korpus
- Fazit
Zielsetzung und Themenschwerpunkte
Diese Seminararbeit bietet eine Einführung in die Korpuslinguistik und beleuchtet die Bedeutung von Textkorpora für die Sprachwissenschaft. Die Arbeit erklärt, was ein Korpus ist, wie es aufgebaut ist und für welche linguistischen Fragestellungen es genutzt werden kann.
- Definition und Bedeutung von Korpora in der Sprachwissenschaft
- Aufbau von Korpora: Repräsentativität, Beständigkeit, Größe, Textproben, Inhalt und Metadaten
- Verwendungsgebiete von Korpora: Erforschung von Sprachstrukturen, Fremdsprachenunterricht, Lexikografie, Grammatikografie und Computerlinguistik
- Arten von Korpora: Computerlesbar vs. nicht-computerlesbar, Gesamtkorpus vs. Teilkorpus, Volltextkorpus vs. Probenkorpus, statisch vs. dynamisch, annotiert vs. nicht-annotiert, geschrieben vs. gesprochen, Gegenwartssprache vs. historische Sprache, Referenzkorpora vs. Spezialkorpora, einsprachig vs. mehrsprachig
- Methoden der Korpusanalyse: Stichwortsuche, Konkordanzen, Kollokationsanalyse, Wortlisten
Zusammenfassung der Kapitel
- Einleitung: Die Einleitung führt in das Thema der Korpuslinguistik ein und stellt die Relevanz von Textkorpora für die Sprachwissenschaft dar. Sie erläutert die Bedeutung des Sprachwandels und die verschiedenen Einsatzmöglichkeiten von Korpora in der linguistischen Forschung.
- Methoden der Sprachwissenschaften: Dieses Kapitel beleuchtet drei verschiedene Methoden der Sprachwissenschaft, die zur Analyse von Sprachgebrauch eingesetzt werden können: Sprecherbefragungen, Experimente und die Verwendung von Sprachdaten (Textkorpora). Die Nachteile der ersten beiden Methoden, wie z.B. die Schwierigkeit, objektive Ergebnisse zu erhalten, werden erläutert.
- Was ist ein Korpus?: Das Kapitel definiert den Begriff "Korpus" als eine Sammlung von schriftlichen oder gesprochenen Äußerungen in einer oder mehreren Sprachen. Es betont die Bedeutung von digitalisierten und maschinenlesbaren Daten in der Korpuslinguistik und erklärt die Rolle von Metadaten und linguistischen Annotationen.
- Wie ist ein Korpus aufgebaut?: Dieses Kapitel befasst sich mit den wichtigen Aspekten des Korpusaufbaus: Repräsentativität, Beständigkeit, Größe, Textproben, Inhalt und Metadaten. Es zeigt, wie diese Faktoren die Qualität und Aussagekraft eines Korpus beeinflussen.
- Wofür werden Korpora verwendet?: Dieses Kapitel zeigt verschiedene Anwendungsbereiche von Korpora in der Sprachwissenschaft, z.B. die Erforschung von sprachlichen Strukturen und Varietäten, die Verwendung im Fremdsprachenunterricht und Übersetzung, die Erstellung von Wörterbüchern und Grammatiken sowie die Anwendung in der Computerlinguistik.
- Welche Arten von Korpora gibt es?: Dieses Kapitel präsentiert eine Reihe von verschiedenen Korpustypen, die nach unterschiedlichen Kriterien kategorisiert werden, z.B. nach ihrer Art der Daten (geschrieben vs. gesprochen), ihrer Zeitlichkeit (Gegenwartssprache vs. historische Sprache) oder ihrer Zielsetzung (Referenzkorpora vs. Spezialkorpora).
- Verfahren zur Analyse von Korpusdaten: Das Kapitel stellt verschiedene Verfahren der Korpusanalyse vor, wie z.B. die Stichwortsuche, die Erstellung von Konkordanzen, die Kollokationsanalyse und die Erstellung von Wortlisten.
- Welche Suchtools gibt es?: Dieses Kapitel gibt einen Überblick über verschiedene Suchtools, die für die Analyse von Korpusdaten genutzt werden können, z.B. das World Wide Web, die Korpora des DWDS, COSMAS II und das TIGER-Korpus.
Schlüsselwörter
Korpuslinguistik, Textkorpus, Sprachwandel, Sprachgebrauch, Repräsentativität, Beständigkeit, Korpusgröße, Textproben, Metadaten, linguistische Annotationen, Erforschung von Sprachstrukturen, Fremdsprachenunterricht, Übersetzung, Lexikografie, Grammatikografie, Computerlinguistik, Stichwortsuche, Konkordanzen, Kollokationsanalyse, Wortlisten, Suchtools.
- Quote paper
- Merve Kosmaz (Author), 2016, Einführung in die Korpuslinguistik. Wie funktioniert eine Korpusuntersuchung?, Munich, GRIN Verlag, https://www.grin.com/document/463785