„Das Ziel einer Faktorenanalyse [FA] ist stets die Zurückführung einer größeren Menge beobachtbarer Variablen auf möglichst wenige hypothetische Variablen“ (Ost 1996). Ihren Ursprung hat dieses Verfahren in der Intelligenzforschung, wo Spearman bereits 1904 einen allgemeinen Intelligenzfaktor zu ermitteln versuchte. Breite Anwendung findet FA bei Persönlichkeitskonstrukten und –tests (Kline 1994) sowie in zahlreichen weiteren Wissenschaftsbereichen. Besonders anschaulich ist die Wirkung der FA in der fernerkundlichen Geographie, wo mittels Satellitenaufnahmen u.a. Karten erstellt werden. Es wurde festgestellt, „that (...) images generated by digital data from various wavelength bands often appear similar and convey essentially the same information. Principal (…) component transformation (…) may be applied (…) as a preprocessing procedure prior to automated classification of the data.” (Lillesand&Kiefer 1979, S. 572).
Faktoranalytische Verfahren werden einerseits zur Datenreduktion angewandt („... the transformations generally increase the computational efficiency“ Lillesand&Kiefer 1979, S. 572), andererseits, um gemeinsame, latente Faktoren (Ost 1996, Hartung&Elpelt 1999 u.v.m.) oder „Supervariablen“ (Eckey et al. 2002) aufzufinden. In Fortführung des Beispiels wäre hier die Zusammenfassung von Bäumen, Grünschattierungen, Waldboden etc. zur Karteninformation „Wald“ denkbar. FA kann explorativ oder konfirmativ erfolgen. Sie ist letztlich ein rein mathematisch formaler Vorgang, der durch den Anwender in den Phasen „Verfahrenswahl“, „Dateninput“ und „Interpretation“ inhaltsorientiert begleitet werden muss.
Eine FA verläuft in der Anwendung folgendermaßen:
1. Aufstellen einer Korrelationsmatrix aus einer Datenmatrix und Test auf Eignung
2. Entscheidung für ein faktoranalytisches Verfahren und gegebenenfalls Festlegung der „Erklärungsgüte“ (=Kommunalitäten) durch die neuen Faktoren
3. Statistisches Schätzen der Bedeutung der einzelnen Faktoren (=Schätzung der Ladungsmatrix)
4. Rotation der Ladungsmatrix zwecks besserer Interpretierbarkeit, ggf. Bestimmung der Faktorwerte
5. Interpretation der Ergebnisse
Diese Seminararbeit fokussiert auf die Schritte 1 bis 3. Die Thematik „Rotation“ und weitere Problemstellungen werden in einer anderen Seminararbeit behandelt.
Inhaltsverzeichnis
1 Einführung
2 Aufstellen der Korrelationsmatrix und Test auf Eignung
3 Herleitung der Ladungsmatrix und grundsätzlicher Lösungsweg
3.1 Entwicklung von Faktorwerte- und Ladungsmatrix
3.2 Bestimmung der Faktorladungen als Eigenwertproblem
3.3 Das Kommunalitätenproblem
4 Schätzen der Ladungsmatrix
4.1 Die Hauptkomponentenmethoden
4.2 Die Maximum Likelihood – Methode
4.3 Weitere Verfahren
4.3.1 Metrisches Datenniveau
4.3.2 Nicht-metrische Verfahren
5 Resumé und Kritik
6 Quellenverzeichnis
7 Abbildungsverzeichnis
1 Einführung
„Das Ziel einer Faktorenanalyse [FA] ist stets die Zurückführung einer größeren Menge beobachtbarer Variablen auf möglichst wenige hypothetische Variablen“ (Ost 1996).
Ihren Ursprung hat dieses Verfahren in der Intelligenzforschung, wo Spearman bereits 1904 einen allgemeinen Intelligenzfaktor zu ermitteln versuchte. Breite Anwendung findet FA bei Persönlichkeitskonstrukten und –tests (Kline 1994) sowie in zahlreichen weiteren Wissenschaftsbereichen. Besonders anschaulich ist die Wirkung der FA in der fernerkundlichen Geographie, wo mittels Satellitenaufnahmen u.a. Karten erstellt werden. Es wird also eine Art Fotografie aus großer Höhe aufgenommen. Dabei wirkt statt einer Linse ein Sensor mit z.B. vier Kanälen. Jeder Kanal zeichnet ein komplettes Bild auf, allerdings nur für ein bestimmtes Intervall des elektromagnetischen Spektrum. Die Kanäle seien hier mit den Spektralfarben Rot, Grün, Blau sowie Infrarot belegt. Es wurde festgestellt, „that (...) images generated by digital data from various wavelength bands often appear similar and convey essentially the same information. Principal (…) component transformation (…) may be applied (…) as a preprocessing procedure proir to automated classification of the data.” (Lillesand&Kiefer 1979, S. 572). Mit „classification“ ist eine Überführung der „Fotoaufnahme“ in eine möglichst homogene Karteninformation gemeint.
Faktoranalytische Verfahren werden einerseits zur Datenreduktion angewandt („... the transformations generally increase the computational efficiency“ Lillesand&Kiefer 1979, S. 572), andererseits, um gemeinsame, latente Faktoren (Ost 1996, Hartung&Elpelt 1999 u.v.m.) oder „Supervariablen“ (Eckey et al. 2002) aufzufinden. In Fortführung des Beispiels wäre hier die Zusammenfassung von Bäumen, Grünschattierungen, Waldboden etc. zur Karteninformation „Wald“ denkbar.
FA kann explorativ oder konfirmativ erfolgen. Sie ist letztlich ein rein mathematisch formaler Vorgang, der durch den Anwender in den Phasen „Verfahrenswahl“, „Dateninput“ und „Interpretation“ inhaltsorientiert begleitet werden muss.
Eine FA verläuft in der Anwendung folgendermaßen:
1. Aufstellen einer Korrelationsmatrix aus einer Datenmatrix und Test auf Eignung
2. Entscheidung für ein faktoranalytisches Verfahren und gegebenenfalls Festlegung der „Erklärungsgüte“ (=Kommunalitäten) durch die neuen Faktoren
3. Statistisches Schätzen der Bedeutung der einzelnen Faktoren (=Schätzung der Ladungsmatrix)
4. Rotation der Ladungsmatrix zwecks besserer Interpretierbarkeit, ggf. Bestimmung der Faktorwerte
5. Interpretation der Ergebnisse
Diese Seminararbeit fokussiert auf die Schritte 1 bis 3. Die Thematik „Rotation“ und weitere Problemstellungen werden in einer anderen Seminararbeit behandelt.
2 Aufstellen der Korrelationsmatrix und Test auf Eignung
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 1: Wertetabelle
Bei wissenschaftlichen Messungen entsteht eine Wertetabelle, die beispielsweise in der Zeile die Messobjekte als Merkmalsträger (z.B. Koordinaten, Produkte, Menschen etc.) aufführt, in der Spalte die gemeinsamen Eigenschaften, die in Variablen gemessen werden. In der Regel werden für jedes Merkmal Messreihen vorliegen, die zumeist im Mittelwert verdichtet werden. Diese Tabelle ergibt eine Datenmatrix D.
Um diese Datenmatrix für die FA vorzubereiten, wird sie standardisiert und anschließend in eine Korrelationsmatrix überführt. Für die Standardisierung wird jeder Wert von D z-transformiert, so dass der Mittelwert jeder Spalte Null und die Varianz Eins ist. Jetzt ist die standardisierte Datenmatrix Z erzeugt. Diese Maßnahme erleichtert Berechnung und Interpretation und ermöglicht eine Vergleichbarkeit, falls Variablen in unterschiedlichen Maßeinheiten erhoben werden (Backhaus et al. 2003).
Aus Z ergibt sich die empirische Korrelationsmatrix R nach folgender Formel:
Abbildung in dieser Leseprobe nicht enthalten
Wird R aus standardisierten Daten errechnet, sind (Varianz-)Kovarianz-Matrix und Korrelationsmatrix identisch.
Nachdem R aufgestellt ist, muss sie auf Eignung überprüft werden, um zu entscheiden, ob die Anwendung einer FA überhaupt sinnvoll ist. Treten zum Beispiel viele kleine Korrelationen auf, deutet dies auf eine heterogene Datenstruktur hin, was die Annahme gemeinsamer Faktoren in Frage stellt. In diesem Fall wäre eine Prüfung der Verteilungen der Variablen angezeigt. Im Umkehrschluss deuten hohe Korrelationen bereits auf mögliche gemeinsame Faktoren hin, erlauben aber kein eindeutiges Urteil über die Eignung (Backhaus et al. 2003).
Echte Prüfungskriterien ergehen aus einem Signifikanztest über die Korrelationen, der Inversen der Korrelationsmatrix, dem Bartlett-Test, der Anti-Image-Kovarianz-Matrix sowie dem Kaiser-Meyer-Olkin-Kriterium. Drei von diesen Kriterien werden im folgenden kurz erläutert.
Der Signifikanztest über die Korrelation ist ein statistisches Testverfahren mit der Nullhypothese „Es besteht kein Zusammenhang zwischen den Variablen“. Über das Signifikanzniveau lässt sich die Irrtumswahrscheinlichkeit bestimmen, diese Hypothese abzulehnen und die getestete Korrelation als signifikant zu betrachten.
Der Bartlett-Test (auf Sphärizität) überprüft, ob die gezogene Stichprobe einer Grundgesamtheit entstammt, in der die Variablen unkorreliert sind. Er setzt voraus, dass die Erhebungsgesamtheit normalverteilt ist und die Prüfgröße annähernd c 2 -verteilt ist.
Das Verfahren von Kaiser, Meyer und Olkin ist gemäß Backhaus et al. (2003) das beste Prüfkriterium. Die Prüfgröße, das „measure of sampling adequacy“ [MSA], zeigt an, in welchem Umfang die Ausgangsvariablen zusammengehören und dient somit als Indikator dafür, ob eine FA sinnvoll erscheint oder nicht.
Zu Details siehe Ost (1996), Mardia et al. (1979), Eckey et. al (2002).
3 Herleitung der Ladungsmatrix und grundsätzlicher Lösungsweg
Die Grundannahme der FA ist, dass sich eine (große) Korrelationsmatrix auf wenige (nicht zusammenhängende) Faktoren zurückführen lässt. Dies geschieht im Rahmen eines linearen Modells, wie es auch zumeist in der Regressionsrechnung verwendet wird.
3.1 Entwicklung von Faktorwerte- und Ladungsmatrix
Jedes Element von Z lässt sich als Regressionsgleichung aus den Faktoren F denken und einer Fehlervariablen E. Das ursprüngliche Anliegen der Intelligenzforschung war ja, die wahren, nicht beobachtbaren Intelligenzfaktoren zu finden. Die Gewichte bzw. Koeffizienten, die die Bedeutung der Faktoren für das jeweilige Merkmal darstellen, heißen im Rahmen der FA Faktorladungen L. Zunächst geht man von der Orthogonalität der Faktoren, also ihrer (linearen) Unabhängigkeit aus. Diese Einschränkung lässt sich später im Zuge der Rotation wieder aufheben, was für eine sinnvolle Interpretation in der Regel wichtig ist (Ost 1996).
Abbildung in dieser Leseprobe nicht enthalten
In Matrixschreibweise lautet die Grundgleichung der Faktoranalyse:
Abbildung in dieser Leseprobe nicht enthalten
[...]
- Arbeit zitieren
- Mirco Wipke (Autor:in), 2004, Faktorenanalyse I: Aufstellen einer Korrelationsmatrix, Festlegen eines faktoranalytischen Verfahrens und Schätzung der Ladungsmatrix, München, GRIN Verlag, https://www.grin.com/document/32041
-
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen.