Bei der Diskriminanzanalyse werden Gruppenunterschiede methodisch analysiert; damit können „zwei oder mehr Gruppen simultan hinsichtlich einer Mehrzahl von Merkmalsvariablen“ untersucht (vgl. Backhaus u.a. 1987, S. 162).1 Mit der Diskriminanzanalyse sollen die beiden folgenden Fragen geklärt werden: 1. „Unterscheiden sich die Gruppen signifikant?“ 2. „Wie lassen sich die Gruppenunterschiede erklären?“ (ebd., S.162) Im Bezug auf die Klassifizierung gibt es noch eine weitere Fragestellung die mit der Diskriminanzanalyse untersucht werden kann: „In welche Gruppen ist ein Objekt, dessen Gruppenzugehörigkeit nicht bekannt ist, aufgrund seiner Merkmalsausprägung einzuordnen?“ (ebd., S.162). Um Objekte deren Gruppenzugehörigkeit noch ungeklärt ist richtig klassifizieren2 zu können, werden Verfahren der Diskriminanzanalyse geliefert, so lässt sich die Wahrscheinlichkeit minimieren, dass die Objekte falsch klassifiziert werden (Fehlklassifikation). Durch diese Verfahren können auch die Kosten für mögliche Klassifikationen verkleinert werden (ebd., S.162). Um eine Diskriminanzanalyse durchführen zu können, müssen zuerst Daten gesammelt werden und diese müssen in bekannter Gruppenzugehörigkeit aufgeführt werden. Im Gegensatz dazu werden die Daten bei der Clusteranalyse unsortiert angegeben. Erst im Laufe der Clusteranalyse werden die Gruppen gebildet, welche dann bei dem Verfahren der Diskriminanzanalyse untersucht werden. Die Clusteranalyse ist demnach ein Verfahren welches eine gute Ergänzung der Diskriminanzanalyse darstellt (ebd., S.162). Zusammenfassen lässt sich dies folgendermaßen: „Die Diskriminanzanalyse zielt darauf ab, vorgegebene Gruppen von Objekten bestmöglich zu trennen [zu “diskriminieren“], wobei es sich um die Zuordnung dieser Objekte zu vorher definierten Gruppen der Grundgesamtheit handelt.
Inhaltsverzeichnis
1. Grundkonzept und Voraussetzungen der/für die Diskriminanzanalyse
2. Formulierung der Diskriminanzfunktion
2.1. Formulierung der Diskriminanzfunktion
2.2. Schätzung der Diskriminanzfunktion
2.3. Prüfung der Diskriminanzfunktion
2.4. Klassifizierung von neuen Elementen
3. Literaturverzeichnis
1. Grundkonzept und Voraussetzungen der/für die Diskriminanzanalyse
Bei der Diskriminanzanalyse werden Gruppenunterschiede methodisch analysiert; damit können „zwei oder mehr Gruppen simultan hinsichtlich einer Mehrzahl von Merkmalsvariablen“ untersucht (vgl. Backhaus u.a. 1987, S. 162).[1]
Mit der Diskriminanzanalyse sollen die beiden folgenden Fragen geklärt werden:
1. „Unterscheiden sich die Gruppen signifikant?“
2. „Wie lassen sich die Gruppenunterschiede erklären?“ (ebd., S.162)
Im Bezug auf die Klassifizierung gibt es noch eine weitere Fragestellung die mit der Diskriminanzanalyse untersucht werden kann: „In welche Gruppen ist ein Objekt, dessen Gruppenzugehörigkeit nicht bekannt ist, aufgrund seiner Merkmalsausprägung einzuordnen?“ (ebd., S.162).
Um Objekte deren Gruppenzugehörigkeit noch ungeklärt ist richtig klassifizieren[2] zu können, werden Verfahren der Diskriminanzanalyse geliefert, so lässt sich die Wahrscheinlichkeit minimieren, dass die Objekte falsch klassifiziert werden (Fehlklassifikation). Durch diese Verfahren können auch die Kosten für mögliche Klassifikationen verkleinert werden (ebd., S.162).
Um eine Diskriminanzanalyse durchführen zu können, müssen zuerst Daten gesammelt werden und diese müssen in bekannter Gruppenzugehörigkeit aufgeführt werden. Im Gegensatz dazu werden die Daten bei der Clusteranalyse unsortiert angegeben. Erst im Laufe der Clusteranalyse werden die Gruppen gebildet, welche dann bei dem Verfahren der Diskriminanzanalyse untersucht werden. Die Clusteranalyse ist demnach ein Verfahren welches eine gute Ergänzung der Diskriminanzanalyse darstellt (ebd., S.162).
Zusammenfassen lässt sich dies folgendermaßen: „Die Diskriminanzanalyse zielt darauf ab, vorgegebene Gruppen von Objekten bestmöglich zu trennen [zu “diskriminieren“], wobei es sich um die Zuordnung dieser Objekte zu vorher definierten Gruppen der Grundgesamtheit handelt. Die Unterschiede zwischen den Gruppen werden durch die Gesamtheit der unabhängigen Merkmale[3] erklärt und sollen durch diese bestmöglich getrennt werden. Bei der Diskriminanzanalyse werden die beobachteten Werte zweier oder mehrer [unabhängiger] metrisch skalierter Merkmale durch die Werte eine abgeleiteten [abhängigen[4]] nominal skalierten Merkmals ersetzt (Schulze 2000, S. 170f.).
Die Diskriminanzanalyse ist ein Verfahren zur Datenreduktion. Bei diesem Verfahren sollen eine Vielzahl von Variablen bei so geringem Informationsverlust wie möglich „durch eine Linearkombination zu einer einzigen Variablen zusammengefaßt“ (Backhaus u.a. 1987, S.163) werden.
Eine bestimmte Menge an Merkmalsvariablen (X1, X2, X3,X4, ... Xj) soll zu einer einzigen Variable (Y) zusammengefasst werden. Die Funktion die zur Kombination von den Merkmalsvariablen verwendet wird als Diskriminanzfunktion (bzw. Trennfunktion) bezeichnet. In der Literatur wird sie zumeist folgendermaßen dargestellt: (vgl. ebd., S163 f.).
Abbildung in dieser Leseprobe nicht enthalten
Mit der Diskriminanzanalyse sollen die Parameter der vorangegangen Diskriminanzfunktion möglichst optimal geschätzt werden. Für die Ausprägung eines Elements i kann über durch die Diskriminanzfunktion der passende Diskriminanzwert Yi errechnet werden. Sind für die beiden Elemente a und b die Diskriminanzwerte Ya und Yb errechnet, so lassen sich die Elemente einfacher vergleichen. Das „Maß für die Unterschiedlichkeit (Diskriminanz) der beiden Elemente“ (ebd., S.164) wird gebildet durch die Differenz der beiden Diskriminanzwerte:
Abbildung in dieser Leseprobe nicht enthalten[5]
Geometrisch kann die Diskriminanzfunktion als Gerade dargestellt werden; diese ist dann die Diskriminanzachse (vgl. ebd.). Auf dieser Achse lassen sich sowohl einzelne Elemente wie auch Centroide von Gruppen[6] lokalisieren, damit können „die Unterschiede zwischen den Elementen und/ oder Gruppen als Distanzen“ (ebd.) repräsentiert werden.
Bevor ich gleich zur Formulierung der eigentlichen Diskriminanzfunktion übergehe, werde ich mich mit der Klassifizierung von Objekten befassen.
Die Einordnung von Elementen in verschiedene Gruppen erfolgt bei der Diskriminanzanalyse unter der zu Hilfenahme verschiedener Ansätze zur so genannten Klassifizierung (vgl. ebd.).
Sind die Diskriminanzwerte gegeben, so kann die Klassifizierung auf zwei Arten erfolgen, zum Einen das Distanzkonzept und zum Anderen das Wahrscheinlichkeitskonzept. Für das Diskriminanzkonzept gilt: ein Element i wird einer Gruppe g zugeordnet, dabei soll die Distanz minimal sein[7] (vgl. ebd.).
Einen Sonderfall des Diskriminanzkonzeptes stellt das „Konzept des kritischen Diskriminanzwertes [dar], das bei nur zwei Gruppen angewendet werden kann“ (ebd., S.166). Die Berechnung des kritischen Mittelwertes als Mittelwert der beiden Gruppencentroide erfolgt, wenn die Gruppen die gleiche Größe aufweisen, die Formel hierzu ist:
Abbildung in dieser Leseprobe nicht enthalten
[...]
[1] „Dabei kann es sich z.B. um Gruppen von Käufern verschiedener Marken, von Wählern verschiedener Parteien oder von Patienten mit verschiednen Symptomen handeln“ (Backhaus u.a. 1987, S.162)
[2] „Der Begriff der Klassifizierung wird mit unterschiedlicher Bedeutung verwendet. Zum einen wird damit die Bildung von Gruppen (Taxonomie), zum anderen die Einordnung von Elementen in vorgegebene Gruppen gemeint. Im Rahmen der Diskriminanzanalyse wird er mit letzterer Bedeutung verwendet“ (ebd., S.162f.)
[3] „Ein Merkmal, dessen Einfluss auf andere (sog. abhängige) Merkmale überprüft wird. Unabhängig heißt jedoch nicht, dass dieses Merkmal von keinem anderen mehr abhängt. Die Unabhängigkeit bezieht sich nur auf die untersuchte Fragestellung. So beeinflusst das unabhängige Merkmal „Bildung“ das abhängige Merkmal „Einkommen“. Andererseits ist aber auch „Bildung“ ein abhängiges Merkmal, da es durch andere Merkmale wie z. B. die soziale oder regionale Herkunft beeinflusst wird (http://www.marktforschung.de/austausch-service/wiki-lexikon/marktforschung/unabhaengiges-merkmal/ 15.10.2008, 15:30).
[4] „Das Merkmal, über das eine Aussage getroffen werden soll. Es wird beobachtet, ob dieses Merkmaldurch andere (sog. unabhängige) Merkmale beeinflusst wird, z. B. wird das abhängige Merkmal„Einkommen“ durch das unabhängige Merkmal„Schulbildung“ beeinflusst, oder anders ausgedrückt: Je besser die Schulbildung, desto höher ist im Durchschnitt das Einkommen von Personen (http://www.marktforschung.de/austausch-service/wiki-lexikon/marktforschung/abhaengiges-merkmal/ 15.10.2008, 15:30).
[5] „Analog kann mit Hilfe der Diskriminanzfunktion auch die Unterschiedlichkeit von Gruppen gemessen werden. Durch Bildung der jeweiligen Mittelwerte der Merkmalsvariablen über die Elemente einer Gruppe g erhält man das Gruppenmittel bzw. Centroid [Abbildung in dieser Leseprobe nicht enthalten] Einfach läßt sich das Centroid der Gruppe g durch den Wert Yg ausdrücken, den man alternativ durch Einsetzen der J Mittelwerte der Merkmalsvariablen in die Diskriminanzfunktion oder als Mittelwert der individuellen Diskriminanzwerte berechnen kann. Die Unterschiedlichkeit zweier Gruppen A und B läßt sich damit intuitiv durch die Differenz[Abbildung in dieser Leseprobe nicht enthalten] messen. ” (Backhaus u.a. 1987, S. 164).
[6] z.B.[Abbildung in dieser Leseprobe nicht enthalten]Centroid von Gruppe g (g= A, B)
[7] Die Berechnung erfolgt nach der Formel: (vgl. ebd.)[Abbildung in dieser Leseprobe nicht enthalten]Dabei gilt: Yi= Diskriminanzwert von Element i und Yg= Centroid der Gruppe g (g=1, ..., G)
-
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen.