Die Literatur zum Data Mining dokumentiert zahlreiche Versuche, aus verschiedenartigsten Datenbeständen neue Erkenntnisse zu gewinnen. Es werden unterschiedliche Algorithmen des Data Mining beschrieben. In dieser Arbeit soll die Eignung Künstlich Neuronaler Netze als Mining-Algorithmen für die Methoden Clustern und Vorhersage untersucht werden. Dabei begrenzt sich die Sichtweise auf Backpropagation - und Kohonen-Netze , da diese Neuronalen Netze für Clustern und Vorhersagen prädestiniert sind. Sie stellen eine Alternative zu den statistischen Methoden zur Prognose- bzw. Clustererstellung dar. Die eingesetzten Neuronalen Netze sollen mit dem K-Means-Verfahren und dem Box-Jenkins-Ansatz verglichen werden.
Die theoretischen Konstrukte werden anhand von Versicherungsdaten evaluiert. Die Ergebnisse zeigen die Vor- und Nachteile der untersuchten Methoden und geben dem Leser eine Handlungsempfehlung für die Auswahl von Data Mining-Algorithmen in der Praxis.
Inhaltsverzeichnis
- 1 Einführung
- 1.1 Problem
- 1.2 Ziel und Aufbau
- 2 Neuronale Netze
- 2.1 Hintergrund - Eine kurze Geschichte der Neuroinformatik
- 2.2 Betriebswirtschaftliche Anwendungen Neuronaler Netze
- 2.3 Grundlagen
- 2.4 Backpropagation-Netze
- 2.5 Eigenschaften
- 2.6 Einordnung
- 3 Cluster und Vorhersage als Bestandteile von Data Mining
- 3.1 Clusteranalyse
- 3.1.1 Einführung
- 3.1.2 Methodischer Hintergrund
- 3.1.2.1 K-Means-Verfahren
- 3.1.2.2 Kohonen Netze (SOM – Self-Organizing Feature Maps)
- 3.2 Vorhersage
- 3.2.1 Einführung
- 3.2.2 Methodischer Hintergrund
- 3.2.2.1 Box-Jenkins Technik
- 3.2.2.2 Backpropagation-Netze
- 3.3 Data Mining
- 3.3.1 Begriffsbestimmung
- 3.3.2 Konzeption des Data Mining
- 3.3.3 Phasenmodell des Data Mining-Prozesses
- 3.3.3.1 Problemdefinition
- 3.3.3.2 Datenaufbereitung
- 3.3.3.3 Data Mining-Analyse
- 3.3.3.4 Interpretation der Ergebnisse
- 4 Einsatz von Neuronalen Netzen in Software-Tools
- 4.1 Ausgangssituation
- 4.2 Eingesetzte Software
- 4.2.1 IBM Intelligent Miner
- 4.2.2 KnowledgeSTUDIO
- 4.2.3 NeuNet Pro
- 4.2.4 SPSS
- 4.2.5 SPSS Clementine
- 4.3 Vorgehensweise
- 4.3.1 Problemdefinition
- 4.3.2 Datenaufbereitung
- 4.3.3 Analyse Clusteranalyse
- 4.3.3.1 Trainieren des Kohonen-Netzes
- 4.3.3.2 Testen des KNN
- 4.3.3.3 Clustern der Versicherungsdaten
- 4.3.3.4 Vergleich mit dem K-Means-Verfahren
- 4.3.3.5 Zusammenfassung
- 4.3.4 Analyse - Prognose
- 4.3.4.1 Trainieren des Netzes
- 4.3.4.2 Testen des KNN
- 4.3.4.3 Prognose der Versicherungsdaten
- 4.3.4.4 Vergleich mit der Box-Jenkins-Technik
- 4.3.4.5 Zusammenfassung
- 5 Resümee und Ausblick
- Einsatz von Neuronalen Netzen im Data Mining
- Vergleich von Neuronalen Netzen mit traditionellen Verfahren
- Anwendungen der Clusteranalyse und Vorhersage
- Evaluierung von Software-Tools für Data Mining
- Analyse von Versicherungsdaten mit Neuronalen Netzen
Zielsetzung und Themenschwerpunkte
Die vorliegende Diplomarbeit untersucht die Anwendung von Neuronalen Netzen im Bereich des Data Mining. Der Fokus liegt dabei auf den Verfahren der Clusteranalyse und Vorhersage. Ziel ist es, die Funktionsweise und Einsatzmöglichkeiten dieser Methoden in der Praxis aufzuzeigen und einen Vergleich mit traditionellen Verfahren durchzuführen. Die Arbeit beinhaltet eine detaillierte Erläuterung der Grundlagen Neuronaler Netze, eine Analyse der Methoden der Clusteranalyse und Vorhersage und die Evaluierung der Resultate von verschiedenen Software-Tools.
Zusammenfassung der Kapitel
Kapitel 1 führt in das Thema der Arbeit ein und definiert das Problem sowie das Ziel der Untersuchung. Kapitel 2 beschäftigt sich mit den Grundlagen Neuronaler Netze, inklusive ihrer Geschichte, Einsatzmöglichkeiten und Eigenschaften. In Kapitel 3 werden die wichtigen Bereiche des Data Mining, Clusteranalyse und Vorhersage, anhand von verschiedenen Verfahren wie dem K-Means-Verfahren und den Kohonen-Netzen erläutert. Kapitel 4 untersucht den praktischen Einsatz von Neuronalen Netzen in Software-Tools und analysiert verschiedene Anwendungsbeispiele, insbesondere die Clusteranalyse und Prognose von Versicherungsdaten. Abschließend werden in Kapitel 5 die Ergebnisse der Arbeit zusammengefasst und ein Ausblick auf zukünftige Forschungsgebiete gegeben.
Schlüsselwörter
Neuronale Netze, Data Mining, Clusteranalyse, Vorhersage, K-Means-Verfahren, Kohonen Netze, Backpropagation-Netze, Box-Jenkins Technik, Software-Tools, IBM Intelligent Miner, KnowledgeSTUDIO, NeuNet Pro, SPSS, SPSS Clementine, Versicherungsdaten, Prognosemodelle.
- Quote paper
- Dr. Thomas Zabel (Author), 2001, Neuronale Netze für Clustern und Vorhersage. Methodenvergleich und Tools, Munich, GRIN Verlag, https://www.grin.com/document/30909