Diese Arbeit beschäftigt sich mit der neuronalen Kodierung von Sprachsignalen im Gehörnerv und im Nucleus cochlearis. Das Hauptaugenmerk liegt dabei auf möglichen neuronalen Repräsentationen der Vokale. In den ersten drei Abschnitten werden die Grundlagen ausführlich dargestellt: die Grundeigenschaften neuronaler Aktivität, die Anatomie und Physiologie des Gehörnervs und des Nucleus cochlearis. Eine derartige Darstellung der Grundlagen ist für das Verständnis der weiteren Ausführungen unentbehrlich. Im vierten Abschnitt werden die zur Zeit bekannten Kodierungsprinzipien akustischer Signale im Allgemeinen vorgestellt, im fünften Abschnitt wird die Effizienz dieser Kodierungsmechanismen anhand der vorliegenden Forschungsliteratur überprüft. Die Arbeit wird von einem Glossar ergänzt, das die wichtigsten Fachtermini mit ihren englischen Entsprechungen auflistet. Angesichts der Tatsache, dass die große Mehrheit der einschlägigen Literatur in englischer Sprache vorliegt, erscheint das unumgänglich.
Inhalt
Vorbemerkung
1. Grundlagen
1.1. Die afferente Hörbahn im Überblick
1.2. Grundeigenschaften der neuronalen Aktivität
2. Anatomie und Physiologie des Gehörnervs
2.1. Anatomie des Gehörnervs
2.2. Feuerungsverhalten der Hörnervfasern
3. Anatomie und Physiologie des Nucleus cochlearis
3.1. Antwortmuster der Neurone im Nucleus cochlearis
3.2. Zytomorphologie des Nucleus cochlearis
4. Kodierungsmechanismen
4.1. Tonotopische Kodierung der Stimulusfrequenz
4.2. Temporale Kodierung der Stimulusfrequenz
4.3. Kodierung der Stimulusintensität
5. Kodierung von Sprachsignalen
5.1. Ortskodierung
5.1.1. Ortskodierung im Gehörnerv
5.1.2. Ortskodierung im Nucleus cochlearis
5.1.3. Schwächen der Ortskodierung
5.2. Temporale Kodierung
5.2.1. Synchronisation im Gehörnerv
5.2.2. Suppression im Gehörnerv
5.2.3. Synchronisation im Nucleus cochlearis
Glossar (deutsch-englisch)
Literatur
Vorbemerkung
Diese Arbeit beschäftigt sich mit der neuronalen Kodierung von Sprachsignalen im Gehörnerv und im Nucleus cochlearis. Das Hauptaugenmerk liegt dabei auf möglichen neuronalen Repräsentationen der Vokale. In den ersten drei Abschnitten werden die Grundlagen ausführlich dargestellt: die Grundeigenschaften neuronaler Aktivität, die Anatomie und Physiologie des Gehörnervs und des Nucleus cochlearis. Eine derartige Darstellung der Grundlagen ist für das Verständnis der weiteren Ausführungen unentbehrlich. Im vierten Abschnitt werden die zur Zeit bekannten Kodierungsprinzipien akustischer Signale im Allgemeinen vorgestellt, im fünften Abschnitt wird die Effizienz dieser Kodierungsmechanismen anhand der vorliegenden Forschungsliteratur überprüft. Die Arbeit wird von einem Glossar ergänzt, das die wichtigsten Fachtermini mit ihren englischen Entsprechungen auflistet. Angesichts der Tatsache, dass die große Mehrheit der einschlägigen Literatur in englischer Sprache vorliegt, erscheint das unumgänglich.
1. Grundlagen
1.1. Die afferente Hörbahn im Überblick
Der auditive Teil des zentralen Nervensystems besteht aus der afferenten (aufsteigenden) und der efferenten (absteigenden) Hörbahn. Die efferente Hörbahn übermittelt Informationen aus dem auditiven Kortex (Hörrinde) zu den unteren Hörzentren. Die afferente Hörbahn verarbeitet Informationen aus der Gehörperipherie und übermittelt sie in den auditiven Kortex. Beide Hörbahnen bestehen aus mehreren Hirnkernen (Nuklei), die ein komplexes Netzwerk mit ipsilateralen, kontralateralen, kollateralen und Bypass-Verbindungen bilden. Sie sind darüber hinaus mit anderen sensorischen und motorischen Systemen verbunden. Zwischen der Cochlea und dem auditiven Kortex werden mehrere Neurone hintereinander geschaltet – deshalb unterscheidet man je nach Lage Neurone erster Ordnung (primäre Neurone – alle Hörnervfasern), zweiter Ordnung, dritter Ordnung usw. Einige Neurone verbinden Nervenzellen innerhalb eines Gehirnkerns ohne Verbindung zu höher gelegenen Nuclei, sie werden als Interneurone bezeichnet. Während die primären Neurone hinsichtlich ihrer Zytomorphologie und ihrer Antworteigenschaften recht uniform sind, ist auf den höheren Stationen eine große Vielfalt an Zelltypen und Antwortmustern, selbst innerhalb eines einzelnen Nucleus, zu verzeichnen. Der Gegenstand der vorliegenden Arbeit sind der Gehörnerv und der erste auditive Hirnkern – der Nucleus cochlearis. Abb. 1 zeigt ihren Platz innerhalb der gesamten afferenten Hörbahn.
1.2. Grundeigenschaften der neuronalen Aktivität
Das Antwortverhalten der auditiven Neurone lässt sich trotz aller morphologischen und physiologischen Unterschiede in gleichen Kategorien und mit gleichen Messverfahren beschreiben. Die unterschiedlichen Verhaltensmuster, die wir beobachten können, resultieren gewissermaßen aus einer unterschiedlichen Parametrisierung verschiedener Grundeigenschaften, die im folgenden näher beschrieben werden.
Abbildung in dieser Leseprobe nicht enthalten
Abb. 1: Schematische Darstellung der afferenten Hörbahn: 1) Nucleus cochlearis; 2) Trapezkörper; 3) oberer Olivenkomplex; 4) Lemniscus lateralis; 5) Colliculus inferior; 6) Corpus geniculatum mediale; 7) auditiver Kortex. Nach Yost (1994), Abb. 16.1.
a) Feuerungsrate – Neurone feuern mit unterschiedlicher Häufigkeit, abhängig von der Intensität und Dauer des Stimulus und von den individuellen Eigenschaften des jeweiligen Neurons. Die Feuerungsrate variiert meist stark während der Stimulusdauer, bedingt durch die individuellen Eigenschaften des betreffenden Neurons, Stimulusparameter und eventuell vorhandene inhibitorische Eingänge (s. unten). Solche Veränderungen können recht groß sein – deshalb wird in vielen Fällen neben der durchschnittlichen Feuerungsrate (Anzahl der Impulse pro Zeiteinheit), welche die Entladungsaktivität während der gesamten Stimulusdauer beschreibt und jeden Impuls in der Zeit gleich gewichtet, auch die momentane Feuerungsrate für ein kleines Zeitfenster errechnet (die durchschnittliche Feuerungsrate kann abrupte Veränderungen der Feuerungsrate nicht befriedigend erfassen).
b) Antwortmuster – die typische Verteilung der Entladungsaktivität eines Neurons in der Zeit kann für einen gegebenen Stimulustyp statistisch ermittelt und in Form eines Reizfolgehistogramms (auch PST-Histogramm[1] genannt) graphisch dargestellt werden – ein solches Histogramm zeichnet die Reaktionen eines einzelnen Neurons auf wiederholte Präsentationen desselben Stimulus auf und macht dadurch Antwortmuster sichtbar, die bei der Betrachtung einer einzelnen Stimuluspräsentation nicht klar erkennbar wären. Die Anzahl der Impulse wird in vertikaler Richtung eingezeichnet, die Zeit seit Stimulusbeginn ist auf der horizontalen Achse ablesbar.
c) Spontanaktivität – Neurone können spontan aktiv sein, d.h. auch in Abwesenheit eines Reizes feuern; diese Spontanaktivität kann unterschiedlich groß sein, sie kann auch ganz fehlen.
d) Schwellenwert – der Reiz muss eine bestimmte Mindestintensität erreichen, um eine neuronale Antwort auszulösen. Diese Mindestintensität wird als Schwellenwert bezeichnet und nimmt für verschiedene Neurone verschiedene Werte an. Bei Neuronen mit Spontanaktivität definiert sich der Schwellenwert als kleinste Stimulusintensität, die notwendig ist, um die Feuerungsrate über das Niveau der Spontanaktivität hinaus zu erhöhen.
e) Dynamikbereich und Sättigung – jedes Neuron kann seine Feuerungsrate nur in einem begrenzten Bereich steigern. Die Größe dieses Bereichs hängt vom Zelltyp ab. Mit steigender Stimulusintensität steigt die Feuerungsrate – allerdings, durch die höchstmögliche Geschwindigkeit der in den Zellen ablaufenden biochemischen
Prozesse bedingt, nicht unendlich: bei einer bestimmten Intensität, die für jede Zelle individuell bestimmt werden muss, stellt sich eine Sättigung der Entladungsaktivität ein – die Feuerungsrate bleibt danach konstant oder sinkt geringfügig. Der individuelle Dynamikbereich einer Zelle kann mit Hilfe der Intensitätsfunktion (Intensitätskennlinie) ermittelt werden (vgl. Abb. 2).
Abbildung in dieser Leseprobe nicht enthalten
Abb. 2: Intensitätsfunktion einer Nervenfaser. Nach Ehret (1996), Abb. 16-13.
f) Frequenzselektivität – Neurone in der afferenten Hörbahn sind in unterschiedlichem Maße frequenzselektiv. Jedes Neuron, wenn auch grundsätzlich von allen Frequenzen erregbar, bevorzugt Stimuli mit einer bestimmten Frequenz – der sog. charakteristischen Frequenz (Bestfrequenz). Die charakteristische Frequenz lässt sich durch die Aufzeichnung der Schwellenwerte für Stimuli mit verschiedenen Frequenzen ermitteln – sie hat den niedrigsten Schwellenwert. Eine graphische Darstellung der
Abb. 3: Ermittlung der charakteristischen Frequenz – oben die Darstellung einer Frequenzantwortkurve, unten die einer Tuning-Kurve (stark vereinfacht); die getesteten Frequenzen sind an der horizontalen Achse ablesbar, die charakteristische Frequenz ist an der höchsten Feuerungsrate bzw. dem niedrigsten Schwellenwert zu erkennen. Nach Yost (1994), Abb. 9.3.
Abbildung in dieser Leseprobe nicht enthalten
Schwellenwerte für verschiedene Frequenzen wird als Tuning-Kurve (Abstimmkurve) bezeichnet, der in dieser Darstellung oberhalb der Tuning-Kurve liegende Bereich heißt Antwortbereich. Alternativ dazu kann die sog. Frequenzantwortkurve ermittelt werden, indem anstelle von Schwellenwerten die ausgelösten Feuerungsraten für verschiedene Frequenzen aufgezeichnet werden (beide Verfahren sind in Abb. 3 dargestellt). Je mehr die Stimulusfrequenz mit der charakteristischen Frequenz einer Nervenzelle übereinstimmt, desto größer ist die Entladungswahrscheinlichkeit und umgekehrt. Aus diesem Grund wird die Funktionsweise der auditiven Neurone mit derjenigen von akustischen Filtern verglichen. Die Filtereigenschaften verschiedener Neurone können recht unterschiedlich sein (von sehr scharf bis sehr grob abgestimmt) und werden im sog. Q10-Faktor festgehalten (charakteristische Frequenz des Neurons dividiert durch die Bandbreite des Antwortbereiches 10 dB oberhalb des Schwellenwertes).
g) Erregung und Hemmung – die neuronale Reaktion auf akustische Stimuli kann von zweifacher Art sein: exzitatorisch (erregend) oder inhibitorisch (hemmend). Die Exzitation ist mit der Aufnahme oder einem Anstieg der Entladungsaktivität gleichbedeutend. Die Inhibition ist mit einer partiellen oder vollständigen Unterdrückung der Entladungsaktivität durch Eingänge aus anderen Nervenzellen gleichbedeutend.
2. Anatomie und Physiologie des Gehörnervs
2.1. Anatomie des Gehörnervs
Der Gehörnerv besteht aus afferenten und efferenten Nervenfasern und ist Teil des achten Hirnnervs. Seine afferenten Fasern (bei Katzen ca. 50.000 pro Ohr, bei Menschen ca. 30.000[2] ) verbinden die Haarzellen der Cochlea mit dem Nucleus cochlearis im Hirnstamm. Ihre Zellkörper bilden ein spiralförmig gedrehtes Bündel, das als Spiralganglion bezeichnet wird. Ihre Dendriten, die den Zellkörper mit den Haarzellen verbinden, teilen sich in mehrere Stränge zu jeweils 30 Fasern auf, die die knöcherne Struktur um die Cochlea durch kleine Öffnungen (habenulae perforatae) passieren.
Afferente Nervenfasern übermitteln Informationen von peripheren Sinnesorganen (beispielsweise inneren Haarzellen) ins Gehirn. Es gibt zwei Arten von afferenten Nervenfasern im Gehörnerv: sternförmige Fasern, auch als Typ I bezeichnet, und äußere spiralförmige Fasern, auch als Typ II bekannt. Fasern vom Typ I machen mit bis zu 95 Prozent die überwiegende Mehrheit der afferenten Fasern aus und innervieren die inneren Haarzellen, die ihrerseits nur ungefähr 20 Prozent der Haarzellenpopulation stellen. Die Verteilung dieser Nervenfasern innerhalb des Gehörnervs ist geordnet: Nervenfasern, die das apikale Ende der Basilarmembran innervieren und für das Verständnis der Sprache besonders wichtig sind, weil sie die niedrigen Frequenzen kodieren, befinden sich im Inneren des Bündels, während die basalen Fasern seine äußeren Ränder bilden. Die Anbindung der sternförmigen Fasern an die Haarzellen ist exklusiv – eine Faser innerviert nur eine Haarzelle, während umgekehrt eine Haarzelle an mehrere Nervenfasern gleichzeitig angeschlossen ist – die Zahl der angeschlossenen Nervenfasern hängt beim Menschen von der Lage der innervierten Haarzelle auf der Basilarmembran ab und schwankt zwischen acht und dreißig. Eine solche Verbindung wird im Englischen als many-to-one-connection bezeichnet. Mit Typ II verhält es sich umgekehrt: eine Faser innerviert mehrere äußere Haarzellen gleichzeitig (one-to-many-connection). Die genaue Funktion dieser Fasern ist noch unbekannt. Fasern vom Typ I sind bipolar und myelinisiert (mit Ausnahme der Strecke von der Haarzelle bis zur habenuela perforata). Fasern vom Typ II sind monopolar und nicht myolinisiert.
2.2. Feuerungsverhalten der Hörnervfasern
Im Folgenden werden die für Gehörnervneurone spezifischen Parametrisierungen der in Kap. 1.2. aufgelisteten Grundeigenschaften besprochen:
a) Antwortmuster – die in Reizfolgehistogrammen beobachteten Antwortmuster der primären Neurone sind im Unterschied zu den Zellen des Nucleus cochlearis sehr uniform. Es lassen sich nur zwei, sehr ähnliche Antwortmuster unterscheiden:
- phasisch-tonisch – nach einem extremen Anstieg der Feuerungsrate am Anfang des Stimulus (phasische Antwort) erfolgt eine Adaptation und die Feuerungsrate bleibt für die restliche Stimulusdauer relativ konstant (tonische Antwort). Nach Abklingen des Stimulus sinkt die Spontanaktivität für einen kurzen Zeitintervall, um danach wieder ihr normales Niveau zu erreichen (vgl. Abb. 4).
Abbildung in dieser Leseprobe nicht enthalten
- tonisch – die initiale phasische Komponente fehlt, die Verteilung der Aktionspotentiale im Reizfolgehistogramm ist gleichmäßig. Dieses Antwortmuster ist für Nervenfasern mit sehr niedriger Spontanaktivität typisch.
b) Spontanaktivität – alle Nervenfasern des Gehörnervs feuern auch in Abwesenheit eines Stimulus. Die Spontanaktivität kann allerdings für verschiedene Fasern sehr unterschiedliche Ausmaße annehmen: ca. 16 Prozent aller Fasern zeigen eine geringfügige Spontanaktivität (unter 0,5 Impulse pro Sekunde), weitere 25 Prozent feuern spontan zwischen 0,5 und 18 Mal pro Sekunde und ca. 60 Prozent zeigen Spontanfeuerungsraten von 18-120 Impulsen pro Sekunde (vgl. Greenberg 1996: 370).
c) Schwellenwert – der Schwellenwert der primären Neurone im Gehörnerv liegt gewöhnlicherweise 5-30 Impulse über dem Niveau der Spontanaktivität. Untersuchungen am Gehörnerv von Katzen[3] haben gezeigt, dass ca. 80 Prozent der Fasern niedrige Schwellenwerte unterhalb von 20 dBSPL haben, die Mehrheit sogar unterhalb von 10 dBSPL. Der Rest deckt den verbleibenden Bereich von 20 bis ca. 80 dBSPL ab. Zwischen dem Schwellenwert und der Spontanaktivität besteht eine Korrelation: Fasern mit niedriger Spontanaktivität haben hohe Schwellenwerte, Fasern mit hoher Spontanaktivität niedrige.
d) Dynamikbereich und Sättigung – der Dynamikbereich der Nervenfasern ist relativ klein und umfasst Schalldruckunterschiede von 20 bis 70 dB, wobei Werte von 30-40 dB selten überschritten werden. Die Sättigung der Entladungsaktivität stellt sich ungefähr 20-50 dB über dem Schwellenwert der jeweiligen Nervenfaser ein.
e) Frequenzselektivität – Nervenfasern mit niedrigen charakteristischen Frequenzen haben hinsichtlich der Frequenzselektivität sehr konstante Eigenschaften – sowohl bei niedrigen, als auch bei hohen Stimulusintensitäten funktionieren sie wie ein scharf abgestimmter Bandpassfilter, der nur auf die eigene charakteristische Frequenz optimal reagiert. Für Fasern mit höheren Bestfrequenzen gilt das nur bei Stimulusintensitäten bis ungefähr 60-70 dB, wobei sie zusätzlich zu ihrer charakteristischen Frequenz eine erhöhte, wenn auch deutlich niedrigere Sensibilität für Frequenzen um 1 kHz zeigen (vgl. Abb. 5). Oberhalb des genannten Grenzwertes verändern sich ihre Filtereigenschaften drastisch – alle Fasern mit charakteristischen Frequenzen von über 1 kHz werden zu einem grob abgestimmten Tiefpassfilter. Ihre Sensibilität für niedrige Frequenzen steigt dann beträchtlich auf Kosten der Sensibilität für die eigene charakteristische Frequenz (vgl. Abb. 6).
Abbildung in dieser Leseprobe nicht enthalten
Abb. 5: Zwei mögliche Tuning-Kurven: links die Kurve einer scharf abgestimmten Nervenfaser mit einer niedrigen charakteristischen Frequenz, rechts die Tuning-Kurve einer Faser mit einer hohen charakteristischen Frequenz und einer (eingeschränkten) Sensibilität für Frequenzen um 1 kHz nach Pickles (1982), Abb. 4.3.
Abbildung in dieser Leseprobe nicht enthalten
Abb. 6: Veränderungen der Frequenzselektivität von Nervenfasern bei hohen Intensitäten: A) Frequenzantwortkurven für eine Faser aus dem oberen tonotopischen Bereich (hohe charakteristische Frequenz; nach Greenberg (1996), Abb. 10-10; B) Frequenzantwortkurven für eine Faser aus dem unteren tonotopischen Bereich; nach Pickles (1982), Abb. 4.7c.
f) Erregung und Hemmung – die primären Neurone des Gehörnervs empfangen keinerlei inhibitorische Eingänge aus anderen Nervenzellen. Die beobachteten Hemmungsphänomene, wie sie sich beispielsweise bei der Beschallung mit zwei konkurrierenden Tönen einstellen, gehen nicht auf hemmende Eingänge aus anderen Neuronen zurück – um diesen Unterschied kenntlich zu machen, bedient sich die Fachterminologie in diesem Fall der Bezeichnung Suppression, während das Wort Inhibition die neuronale Hemmung bezeichnet (Ehret 1996: 367).
[...]
[1] Zu engl. post stimulus time.
[2] Diese Zahl stammt aus Pickles (1982: 71), in Gulick, Gescheider und Frisina (1989: 161) wird 50.000 angegeben.
[3] Durchgeführt von Libermann und Kiang, Angabe nach Pickles (1982).
- Citar trabajo
- Cezary Bazydlo (Autor), 2003, Neuronale Kodierung von Sprachsignalen auf den unteren Stationen der afferenten Hörbahn (Gehörnerv und Nucleus cochlearis), Múnich, GRIN Verlag, https://www.grin.com/document/35469
-
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X.