Das Forschungsgebiet Natural Language Processing ist eng mit der Erforschung der menschlichen Sprache an sich verknüpft. Dabei geben insbesondere Fehler, die während der menschlichen Sprachproduktion auftreten, Aufschluss über kognitive Prozesse der Sprachverarbeitung.
Am Max-Planck-Institut in Nijmegen beschäftigt man sich diesbezüglich interdisziplinär mit der Struktur und dem Gebrauch natürlicher Sprache in den vier Arbeitsbereichen Sprachproduktion, Sprachverstehen, Spracherwerb sowie Sprache und Kognition. Wie auch die anderen MPI, befindet es sich unter der Trägerschaft der Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V. Dieser gemeinnützige Verein wurde in Göttingen 1948 gegründet und ist nach Selbstdefinition eine Forschungsorganisation autonomer Grundlagenforschung von internationalem Rang.
Im Bereich Sprachproduktion wurde in Nijmegen auch der Wortplanungsprozess untersucht. Der Wortplanungsprozess umfasst den Vorgang der Wortauswahl aus verschiedenen miteinander konkurrierenden Konzepten bis zur Artikulation. Er lässt sich in die beiden nacheinander erfolgenden Hauptprozesse Wortauswahl und Wortenkodierung einteilen. Während der Wortauswahl wird das benötigte Lemma, das ist das Wort inklusive seiner syntaktischen Eigenschaften, selektiert. Im zweiten Schritt, dem Enkodierungsprozess, erhält das geplante Wort unter anderem Zugriff auf die zugehörigen Phoneme, Morpheme und Silben. Danach erhalten die Artikulationsorgane Zugriff auf allen relevanten Informationen, um das Wort produzieren zu können.
Der Niijmegener Forscher Ardi Roelofs hat sich im Rahmen seines Computermodells WEAVER (Word Encoding by Activation an VERification) dem zweiten Hauptprozess der Wortenkodierung gewidmet. Er hat WEAVER entwickelt um zu zeigen, welche Teilschritte der Wortenkodierung vorausgehen und schließlich zur Wortproduktion führen. Die untersuchten Sprachen hinsichtlich des Modells sind Englisch, Deutsch und Niederländisch. Dieses Modell soll im Laufe der vorliegenden Arbeit ausführlich vorgestellt werden.
Inhaltsverzeichnis
- Einleitung
- Zwei gegensätzliche Sprachproduktionsmodelle
- Einordnung des Roelofs'schen Modells
- Hybrider Ansatz
- Einordnung des Roelofs'schen Modells
- Motivation WEAVER zu entwickeln
- Grundlegende Merkmale von WEAVER
- Retrieval by spreading activation
- Verification of activated information by a production rule
- Incremental construction of phonological representations using a principle of active syllabification
- Active competitive selection of syllabic motor programs
- Association of phonological speech errors With the selection of syllabic motor programs due to the failure of verification
- Funktionsweise von WEAVER
- Prozesse der Wortenkodierung in WEAVER am Beispiel des Wortes Ende
- Die drei Stufen der Enkodierung
- "Picture-word interference paradigm" und "implicit priming"
- "Implicit priming"
- Beschleunigende Wirkung eines "prime" in der Anfangssilbe
- Picture-word interference paradigm
- Generelle Arbeitsweise eines distractor
- "Implicit priming"
- Computersimulation durch WEAVER
- Picture-word interference paradigm
- Generell hemmende Wirkung durch ein distractor word
- Beschleunigende Wirkung durch ein related distractor word
- Begin- versus end-related
- Auswirkung "aligned" versus "non-aligned"
- "Implicit Priming paradigmn und 'Suspend/resume mechanism"
- Versprecher (phonological speech errors)
- Picture-word interference paradigm
- Schlusswort
- Literaturangaben
- Anhang
- Anhang 1
- Anhang 2
- Anhang 3
- Anhang 4
- Anhang 5
Zielsetzung und Themenschwerpunkte
Die Arbeit stellt das Computermodell WEAVER (Word Encoding by Activation an VERification) von Ardi Roelofs vor, das den Prozess der Wortenkodierung in der Sprachproduktion untersucht. Das Modell soll die Teilschritte der Wortenkodierung aufzeigen, die schließlich zur Wortproduktion führen. Die Arbeit analysiert WEAVER im Kontext anderer Sprachproduktionsmodelle und beleuchtet die Motivation für die Entwicklung des Modells.
- Die Funktionsweise von WEAVER
- Die drei Stufen der Enkodierung: morphologische, phonologische und phonetische Enkodierung
- Die Rolle von "spreading activation" und Produktionsregeln in WEAVER
- Die Computersimulation von Sprachproduktionsexperimenten mit WEAVER
- Die Anwendung von WEAVER zur Verbesserung von Sprachsynthesemodulen
Zusammenfassung der Kapitel
Die Einleitung führt in das Forschungsgebiet der natürlichen Sprachverarbeitung ein und erläutert die Bedeutung von Sprachfehlern für die Erforschung kognitiver Prozesse. Sie stellt das Max-Planck-Institut in Nijmegen und seine Forschungsbereiche vor, insbesondere die Sprachproduktion. Im Fokus steht der Wortplanungsprozess, der in die beiden Teilprozesse Wortauswahl und Wortenkodierung unterteilt wird. Das Modell WEAVER von Ardi Roelofs konzentriert sich auf den zweiten Teilprozess, die Wortenkodierung, und untersucht die Teilschritte, die zur Wortproduktion führen.
Kapitel 2 präsentiert zwei gegensätzliche Sprachproduktionsmodelle: das diskrete Modell von Roelofs und das interaktive Modell von Dell. Das diskrete Modell von Roelofs fokussiert auf die chronometrische Tradition, die den Zeitbedarf von Äußerungen untersucht, während das interaktive Modell von Dell den ständigen Informationsfluss zwischen verschiedenen Ebenen des Sprachproduktionsprozesses betont. Das Kapitel ordnet WEAVER in die chronometrische Tradition ein und zeigt auf, dass es sich um ein hybrides Modell handelt, das Elemente der beiden Ansätze kombiniert.
Kapitel 3 erläutert die Motivation für die Entwicklung von WEAVER. Roelofs identifizierte Phänomene in der Sprachproduktion, die in bestehenden Modellen nicht ausreichend erklärt wurden. Dazu gehören die störende Wirkung von "distractor words" auf die Wortproduktion, die flexible Silbenzugehörigkeit von Phonemen und die kontextabhängige Realisation von Phonemen.
Kapitel 4 beschreibt die grundlegenden Merkmale von WEAVER. Das Modell basiert auf dem Prinzip "spreading activation" und verwendet Produktionsregeln zur Verifikation aktivierter Informationen. Die Phoneme werden den Silben nach dem Prinzip "incremental production" zugewiesen, und die Auswahl des silbischen Motorprogramms erfolgt durch einen mathematischen Formalismus, der die Konkurrenz zwischen aktiven Programmknoten berücksichtigt.
Kapitel 5 erläutert die Funktionsweise von WEAVER. Das Modell simuliert den Prozess der Wortenkodierung, der in drei Stufen unterteilt wird: morphologische, phonologische und phonetische Enkodierung. Das Kapitel zeigt anhand des Beispiels des Wortes "Ende" auf, wie WEAVER die einzelnen Stufen der Enkodierung simuliert und wie die Produktionsregeln die Zuweisung von Morphemen, Phonemen und Silben steuern.
Kapitel 6 stellt zwei Arten von chronometrischen Experimenten zur Sprachproduktion vor: das "picture-word interference paradigm" und das "implicit priming". Diese Experimente untersuchen, unter welchen Bedingungen ein Sprecher Äußerungen schneller oder langsamer produzieren kann. Das Kapitel erläutert die Funktionsweise der beiden Experimente und beschreibt die Rolle von "distractors" und "primes" in der Sprachproduktion.
Kapitel 7 präsentiert die Ergebnisse der Computersimulationen mit WEAVER. Das Modell konnte die Ergebnisse real durchgeführter Experimente zum "picture-word interference paradigm" und zum "implicit priming" nachbilden. Das Kapitel zeigt, wie WEAVER die hemmende und beschleunigende Wirkung von "distractors" simuliert und wie es die Auswirkungen von "aligned" und "non-aligned" Bedingungen berücksichtigt. Außerdem wird die Simulation von Versprechern durch WEAVER erläutert.
Kapitel 8 fasst die Erkenntnisse aus WEAVER zusammen und diskutiert deren Anwendungsmöglichkeiten. Das Modell kann zur Verbesserung von Sprachsynthesemodulen beitragen, indem es die prosodischen Merkmale der natürlichen Sprache berücksichtigt. Die Erkenntnisse aus WEAVER könnten dazu beitragen, künstlich erzeugte Sprache natürlicher klingen zu lassen.
Schlüsselwörter
Die Schlüsselwörter und Schwerpunktthemen des Textes umfassen die Wortekodierung, Sprachproduktion, WEAVER, "spreading activation", Produktionsregeln, "incremental production", "picture-word interference paradigm", "implicit priming", Sprachsynthese und prosodische Merkmale.
- Quote paper
- Simone Kotarra (Author), 2006, Natural Language Processing (NLP) in wissenschaftlichen Instituten, Munich, GRIN Verlag, https://www.grin.com/document/50705
-
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X.