Die Clusteranalyse ist ein multivariates statistisches Verfahren zur Klassenbildung. Das Ziel der Clusteranalyse besteht darin, möglichst homogene Gruppen aus einer Menge von Objekten zu klassifizieren, wobei sich die Gruppen möglichst heterogen voneinander unterscheiden sollen.
[...]
Bei der Auswahl des Clusteralgorithmus unterscheidet man zwischen den Hierarchischen Clusterverfahren und den Partitionierenden Clusterverfahren. Dabei werden die Hierarchische Clustermethoden in agglomerative und divisive Clusterverfahren unterteilt. Die agglomerativen hierarchischen Clusterverfahren beginnen mit der feinsten Partition [...]. Bei divisiven hierarchischen Clusterverfahren wird mit der gröbsten Partition gestartet [...].
Die partitionierenden Clusterverfahren beginnen mit einer fest vorgegebenen Anfangspartition, die im Bezug auf ein bestimmtes Gütekriterium, wie z.B. das Varianzkriterium, sukzessive verbessert wird. [...] Die partitionierenden Clusterverfahren unterscheiden sich in optimierende Austauschverfahren und Minimal-Distanz-Verfahren. [...]
Der Two-Step-Clusteralgorithmus ist ein zweistufiges Clusterverfahren zur Klassenbildung. In der ersten Stufe des Verfahrens wird zunächst eine grobe und vereinfachte Clusterung aller Objekte vorgenommen, die dann in der zweiten
Stufe mit einer rechenaufwändigeren hierarchischen Clusteranalyse zu präziseren Clustern verdichtet wird. [...]
Dabei unterscheidet sich der Two-Step-Clusteralgorithmus in SPSS im Vergleich zu den anderen Clusterverfahren insbesondere im Algorithmus, nach dem die Clusterbildung vorgenommen wird. [...]
Das Verfahren des Two-Step-Clusteralgorithmus basiert auf dem so genannten BIRCH-Algorithmus, der vorwiegend für die Clusterung sehr umfangreicher Datensätze angewendet wird.
Im Folgenden wird ganz kurz der Ablauf des BIRCH-Algorithmus dargestellt. [...]
Inhaltsverzeichnis
- Einführung in die Clusteranalyse
- Problemstellung der Clusteranalyse
- Ablauf der Clusteranalyse
- Der Two-Step-Clusteralgorithmus in SPSS
- Problemstellung des Verfahrens
- Ablauf der zweistufigen Clusteranalyse
- Erste Stufe: Vorläufige Clusterung aller Objekte
- Zweite Stufe: Hierarchische Clusterung der Sub-Cluster
- Distanzmaße des Two-Step-Clusteralgorithmus
- Anwendung des Two-Step-Clusteralgorithmus in der Praxis
- Beschreibung des empirischen Datensatzes
- Durchführung der Two-Step-Clusteranalyse
- Auswertung der Ergebnisse des Clusterverfahrens
- K-Means-Clusteranalyse
- Beschreibung und Problemstellung der k-means-Methode
- Ablaufschema der k-Means-Clusteranalyse
- Anwendung der k-Means-Methode in der Praxis
- Problematik des empirischen Datensatzes
- Durchführung der k-Means-Clusteranalyse
- Auswertung der Ergebnisse der Clusteranalyse
- Vergleich der beiden Clusterverfahren
- Theoretischer Vergleich
- Vergleich der SPSS-Ergebnisse
- Schlussfolgerung
- A Statements der Usage & Attitudes-Studie
- B Balkendiagramme der Clusterprofile
- C SPSS-Ausdrücke
- Literaturverzeichnis
Zielsetzung und Themenschwerpunkte
Die vorliegende Arbeit befasst sich mit dem Two-Step-Clusteralgorithmus in SPSS und vergleicht ihn mit der k-Means-Clusteranalyse. Ziel ist es, die Funktionsweise des Two-Step-Clusteralgorithmus zu erläutern, seine Anwendung in der Praxis zu demonstrieren und ihn mit der k-Means-Methode zu vergleichen.
- Methodenbeschreibung des Two-Step-Clusteralgorithmus
- Vergleich mit der k-Means-Clusteranalyse
- Anwendung beider Verfahren in der Praxis
- Bewertung der Ergebnisse und Schlussfolgerungen
- Diskussion der Vor- und Nachteile der beiden Verfahren
Zusammenfassung der Kapitel
Das erste Kapitel führt in die Clusteranalyse ein und erläutert die Problemstellung und den allgemeinen Ablauf des Verfahrens. Es werden die verschiedenen Arten von Clusterverfahren, wie hierarchische und partitionierende Verfahren, vorgestellt.
Kapitel 2 widmet sich dem Two-Step-Clusteralgorithmus in SPSS. Es werden die Problemstellung des Verfahrens, der Ablauf der zweistufigen Clusteranalyse und die Distanzmaße des Algorithmus detailliert beschrieben.
Kapitel 3 zeigt die Anwendung des Two-Step-Clusteralgorithmus in der Praxis anhand eines empirischen Datensatzes. Es werden die Durchführung der Clusteranalyse und die Auswertung der Ergebnisse dargestellt.
Kapitel 4 beschreibt die k-Means-Clusteranalyse, ihre Problemstellung und den Ablauf des Verfahrens.
Kapitel 5 demonstriert die Anwendung der k-Means-Methode in der Praxis anhand desselben empirischen Datensatzes wie in Kapitel 3. Es werden die Durchführung der Clusteranalyse und die Auswertung der Ergebnisse dargestellt.
Kapitel 6 vergleicht die beiden Clusterverfahren theoretisch und anhand der SPSS-Ergebnisse. Es werden die Vor- und Nachteile der beiden Verfahren diskutiert und eine Schlussfolgerung gezogen.
Schlüsselwörter
Die Schlüsselwörter und Schwerpunktthemen des Textes umfassen die Clusteranalyse, den Two-Step-Clusteralgorithmus, die k-Means-Clusteranalyse, SPSS, Methodenbeschreibung, Vergleich, Anwendung, empirische Datenanalyse, Auswertung, Vor- und Nachteile, Schlussfolgerung.
- Quote paper
- Josef Seibold (Author), 2008, Der Two-Step-Clusteralgorithmus in SPSS: Methodenbeschreibung und Vergleich mit der k-Means Clusteranalyse, Munich, GRIN Verlag, https://www.grin.com/document/129422