Das Forschungsgebiet Natural Language Processing ist eng mit der Erforschung der menschlichen Sprache an sich verknüpft. Dabei geben insbesondere Fehler, die während der menschlichen Sprachproduktion auftreten, Aufschluss über kognitive Prozesse der Sprachverarbeitung.
Am Max-Planck-Institut in Nijmegen beschäftigt man sich diesbezüglich interdisziplinär mit der Struktur und dem Gebrauch natürlicher Sprache in den vier Arbeitsbereichen Sprachproduktion, Sprachverstehen, Spracherwerb sowie Sprache und Kognition. Wie auch die anderen MPI, befindet es sich unter der Trägerschaft der Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V. Dieser gemeinnützige Verein wurde in Göttingen 1948 gegründet und ist nach Selbstdefinition eine Forschungsorganisation autonomer Grundlagenforschung von internationalem Rang.
Im Bereich Sprachproduktion wurde in Nijmegen auch der Wortplanungsprozess untersucht. Der Wortplanungsprozess umfasst den Vorgang der Wortauswahl aus verschiedenen miteinander konkurrierenden Konzepten bis zur Artikulation. Er lässt sich in die beiden nacheinander erfolgenden Hauptprozesse Wortauswahl und Wortenkodierung einteilen. Während der Wortauswahl wird das benötigte Lemma, das ist das Wort inklusive seiner syntaktischen Eigenschaften, selektiert. Im zweiten Schritt, dem Enkodierungsprozess, erhält das geplante Wort unter anderem Zugriff auf die zugehörigen Phoneme, Morpheme und Silben. Danach erhalten die Artikulationsorgane Zugriff auf allen relevanten Informationen, um das Wort produzieren zu können.
Der Niijmegener Forscher Ardi Roelofs hat sich im Rahmen seines Computermodells WEAVER (Word Encoding by Activation an VERification) dem zweiten Hauptprozess der Wortenkodierung gewidmet. Er hat WEAVER entwickelt um zu zeigen, welche Teilschritte der Wortenkodierung vorausgehen und schließlich zur Wortproduktion führen. Die untersuchten Sprachen hinsichtlich des Modells sind Englisch, Deutsch und Niederländisch. Dieses Modell soll im Laufe der vorliegenden Arbeit ausführlich vorgestellt werden.
Inhaltsverzeichnis
- Einleitung
- Zwei gegensätzliche Sprachproduktionsmodelle
- Einordnung des Roelofs'schen Modells
- Hybrider Ansatz
- Einordnung des Roelofs'schen Modells
- Motivation WEAVER zu entwickeln
- Grundlegende Merkmale von WEAVER
- Retrieval by spreading activation
- Verification of activated information by a production rule.
- Incremental construction of phonological representations using a principle of active syllabification
- Active competitive selection of syllabic motor programs.
- Association of phonological speech errors with the selection of syllabic motor programs due to the failure of verification
- Funktionsweise von WEAVER
- Prozesse der Wortenkodierung in WEAVER am Beispiel des Wortes Ende
- Die drei Stufen der Enkodierung
- "Picture-word interference paradigm” und “implicit priming”
- „Implicit priming”
- Beschleunigende Wirkung eines „prime“ in der Anfangssilbe
- Picture-word interference paradigm
- Generelle Arbeitsweise eines distractor
- „Implicit priming”
- Computersimulation durch WEAVER
- Picture-word interference paradigm
- Generell hemmende Wirkung durch ein distractor word
- Beschleunigende Wirkung durch ein related distractor word
- Begin- versus end-related
- Auswirkung „aligned“ versus „non-aligned“
- "Implicit Priming paradigm" und "suspend/resume mechanism"
- Versprecher (phonological speech errors)
- Picture-word interference paradigm
Zielsetzung und Themenschwerpunkte
Diese Arbeit befasst sich mit dem Computermodell WEAVER, entwickelt von Ardi Roelofs am Max-Planck-Institut in Nijmegen. WEAVER zielt darauf ab, die Prozesse der Wortekodierung im menschlichen Sprachproduktionssystem zu modellieren und zu simulieren.
- Das Modell WEAVER als eine hybride Kombination aus "chronometric tradition" und "speech error tradition"
- Die Rolle von "spreading activation" und "verification" in der Wortekodierung
- Die Funktionsweise des Modells WEAVER anhand des "picture-word interference paradigm" und "implicit priming"
- Die Simulation von Versprechern (phonological speech errors) im Modell
- Die Bedeutung von WEAVER für das Verständnis der menschlichen Sprachproduktion
Zusammenfassung der Kapitel
Die Einleitung präsentiert die Thematik und den Forschungsrahmen der Arbeit. Sie stellt das Max-Planck-Institut in Nijmegen und dessen Forschungsbereiche vor und erläutert den Fokus auf den Prozess der Wortenkodierung im Rahmen der Sprachproduktion.
Kapitel 2 führt in zwei gegensätzliche Sprachproduktionsmodelle ein: Das diskrete Modell von Roelofs und das interaktive Modell von Dell. Die Einordnung des Roelofs'schen Modells in die "chronometric tradition" und dessen hybriden Ansatz, der auch Elemente der "speech error tradition" aufnimmt, wird diskutiert.
Kapitel 3 erläutert die Motivation zur Entwicklung von WEAVER, die auf den beobachteten Phänomenen der Sprachproduktion beruht, die von bisherigen Modellen nicht ausreichend erklärt wurden, wie beispielsweise die zeitnahe Konfrontation mit "distractor words" und die flexible Silbenzugehörigkeit von Phonemen.
Kapitel 4 beschreibt die grundlegenden Merkmale von WEAVER. Es werden die Mechanismen von "spreading activation", "verification", "incremental construction" und "active competitive selection" im Detail vorgestellt.
Kapitel 5 befasst sich mit der Funktionsweise von WEAVER und demonstriert die Prozesse der Wortenkodierung anhand des Beispiels des Wortes "Ende". Die drei Stufen der Enkodierung werden erläutert.
Kapitel 6 beleuchtet zwei experimentelle Paradigmen: "Picture-word interference paradigm" und "implicit priming". Die Wirkung von "primes" und "distractors" auf die Wortproduktion wird analysiert.
Kapitel 7 widmet sich der Computersimulation durch WEAVER und untersucht die Auswirkungen von "distractor words" auf die Wortproduktion im "Picture-word interference paradigm". Die Simulation von Versprechern (phonological speech errors) wird ebenfalls behandelt.
Schlüsselwörter
Die wichtigsten Schlüsselwörter dieser Arbeit sind: WEAVER, Wortenkodierung, Sprachproduktion, Sprachmodelle, "chronometric tradition", "speech error tradition", "spreading activation", "verification", "incremental construction", "picture-word interference paradigm", "implicit priming", Versprecher (phonological speech errors).
- Arbeit zitieren
- Simone Kotarra (Autor:in), 2006, Natural Language Processing (NLP) in wissenschaftlichen Instituten, München, GRIN Verlag, https://www.grin.com/document/50705