Principles and methods of data mining are a widespread area, i.e. retail dealer use data mining tools to analyze the behavior of customers, computer hardware supplier use data mining to optimize their inventory. There are multiple possibilities of using data mining techniques, even in technical and scientific areas of applications. In regard of manyfold fields of application, there are no less than the number of techniques and methods for Data Mining in existence. Another field to apply Data Mining technique is the domain of simulation. Simulation is the computer-based approach of executing and experimenting of and with models. One aim of this thesis is to analyze data mining tools to see how capable they are solving data mining duties with respect to data calculated by simulation. Different data mining tools are analyzed, commercial tools like SPSS and SPSS Clementine as well as established and freely available tools like WEKA and the R-Project. These tools are analyzed in matters of their data mining functionalities, options to access different data sources, and their complexity of different data mining algorithms. Beyond the analysis of data mining tools with respect to functionality and simulation, envi-ronments for modeling and simulation are analyzed with respect to their possibilities of the utilization for data mining. These environments are the commercial tools Arena and Any-Logic and the freely available SeSam-Project. The effect of all processes of analyzing is a ranking of commonly used data mining tech-niques and concepts. The second part of the thesis occupies with the problem, which data mining method or technique is useful to analyze data provided by a simulation process. It also concerns in which way a method is suitable for the validation of a certain model. In the long run of this thesis the chosen data mining technique is applied to data generated by a simulation process of diffusion and reaction of substances.
Inhaltsverzeichnis
- Abstract (Englische Zusammenfassung)
- Abbildungsverzeichnis
- Abkürzungsverzeichnis
- Vorwort
- 1. Einleitung
- 1.1 Data Mining
- 1.2 Simulation
- 1.3 Zusammenführung und Ziele
- 2. Simulation
- 2.1 Definitionen
- 2.1.1 Definition System
- 2.1.2 Definition Modell/Modellierung
- 2.1.3 Definition Simulation
- 2.2 Aufgabenfelder/Anwendungsbereiche
- 2.2.1 Vor- und Nachteile der Simulation
- 2.2.1.1 Vorteile der Simulation
- 2.2.1.2 Nachteile der Simulation
- 2.2.2 Simulationsarten
- 2.2.2.1 Kontinuierliche Simulation
- 2.2.2.2 Diskrete Simulation
- 2.2.2.3 Monte Carlo Simulation
- 2.3 James II
- 2.3.1 Hintergrund
- 2.3.2 Ziele
- 2.3.3 Einordnung und Entwicklungen
- 2.3.4 Entwicklungsstand
- 3. Data Mining
- 3.1 Definition
- 3.2 Ziel(e) des Data Mining
- 3.3 Data Mining als Prozess
- 3.4 Grundlegende Methoden
- 3.4.1 Klassenbildung
- 3.4.2 Assoziationen
- 3.4.3 Klassifizierung
- 3.4.4 Zeitreihenanalyse
- 3.5 Optimierung von Data Mining-Modellen und genetische Algorithmen
- 3.6 Einsatz von Data Mining in der Simulation
- 4. Vergleichskriterien
- 4.1 Evaluation der Analysearten
- 4.1.1 Klassenbildung
- 4.1.2 Assoziationen
- 4.1.3 Klassifizierung
- 4.1.4 Zeitreihenanalyse
- 4.2 Klassifizierung von Data Mining-Werkzeugen
- 4.2.1 Erweiterungen von DBMS
- 4.2.2 Data Mining-Suiten
- 4.2.3 Eigenständige Data Mining-Tools
- 4.3 Bewertung der Data Mining-Werkzeuge
- 4.3.1 Generelle Eigenschaften
- 4.3.2 Datenbankanbindung
- 4.3.3 Data Mining-Aufgaben
- 4.3.4 Data Mining-Algorithmen
- 4.4 Nutzung von Data Mining in konkreten Simulationsaufgaben
- 5. Analyse
- 5.1 Analyse Modellierungs- und Simulations-Umgebungen
- 5.1.1 Arena
- 5.1.1.1 Beurteilung der Data Mining-Funktionen
- 5.1.1.1.1 Externe Datenquellen
- 5.1.1.1.2 Analyse und Optimierung
- 5.1.1.1.3 Präsentation
- 5.1.2 AnyLogic
- 5.1.2.1 Beurteilung der Data Mining-Funktionen
- 5.1.2.1.1 Externe Datenquellen
- 5.1.2.1.2 Analyse und Optimierung
- 5.1.2.1.3 Präsentation
- 5.1.3 SeSam
- 5.1.3.1 Beurteilung der Data Mining-Funktionen
- 5.1.1.3.1 Externe Datenquellen
- 5.1.1.3.2 Analyse und Optimierung
- 5.1.1.3.3 Präsentation
- 5.2 Analyse einer Bibliothek
- 5.2.1 WEKA
- 5.2.1.1 Generelle Eigenschaften
- 5.2.1.2 Datenbankanbindung
- 5.2.1.3 Data Mining-Aufgaben
- 5.2.1.4 Data Mining-Algorithmen
- 5.3 Analyse eines Werkzeuges
- 5.3.1 SPSS
- 5.3.1.1 SPSS Basispaket (,,SPSS Base")
- 5.3.1.1.1 Generelle Eigenschaften
- 5.3.1.1.2 Datenbankanbindung
- 5.3.1.1.3 Data Mining-Aufgaben
- 5.3.1.1.4 Data Mining-Algorithmen
- 5.3.1.2 SPSS Clementine
- 5.3.1.2.1 Generelle Eigenschaften
- 5.3.1.2.2 Datenbankanbindung
- 5.3.1.2.3 Data Mining-Aufgaben
- 5.3.1.2.4 Data Mining-Algorithmen
- 5.3.2 R-Project/R
- 5.3.2.1 Generelle Eigenschaften
- 5.3.2.2 Datenbankanbindung
- 5.3.2.3 Data Mining-Aufgaben
- 5.3.2.4 Data Mining-Algorithmen
- 6. Vergleich und Implementationsentscheidung
- 6.1 Analyse des zugrunde liegenden Datenmaterials (James II)
- 6.2 Abschließender Vergleich
- 6.2.1 Modellierungs- und Simulationsumgebungen
- 6.2.2 Werkzeuge
- 6.2.3 Bibliotheken
- 6.3 Ranking der Analysemethoden
- 6.4 Implementationsentscheidung
- 7. Implementierung
- 7.1 Zugrunde liegende Annahmen
- 7.2 Hilfsklassen
- 7.2.1 Chi-Quadrat-Berechnungen
- 7.2.2 Kendalls Tau
- 7.2.3 Lineare Korrelation nach Pearson
- 7.2.4 Kontingenztabellen
- 7.2.5 Student t-Test
- 7.2.6 Weitere Hilfsklassen
- 7.3 Klassen und Methoden des K-Means-Algorithmus
- 8. Auswertung von Simulationsdaten
- 8.1 Grundmodell
- 8.1.1 Vorausgesetztes Datenmaterial
- 8.1.2 Vorverarbeitung
- 8.2 Vorgaben
- 8.3 Ergebnisse
- 8.3.1 Cluster-Analyse mit SPSS
- 8.3.2 Cluster-Analyse mit dem in James II implementierten Algorithmus
- 8.4 Beurteilung des implementierten Algorithmus
- 9. Fazit und Zusammenfassung der Ergebnisse dieser Bachelor-Arbeit
- Literaturverzeichnis
Zielsetzung und Themenschwerpunkte
Die Bachelorarbeit befasst sich mit der Integration von Data Mining-Methoden in Simulationsumgebungen. Das Ziel ist es, die Möglichkeiten und Herausforderungen der Anwendung von Data Mining-Techniken zur Analyse und Optimierung von Simulationsmodellen zu untersuchen. Die Arbeit analysiert verschiedene Data Mining-Werkzeuge und -Methoden und bewertet deren Eignung für den Einsatz in der Simulation.
- Integration von Data Mining in Simulationsumgebungen
- Analyse und Bewertung von Data Mining-Werkzeugen
- Anwendung von Data Mining-Methoden zur Optimierung von Simulationsmodellen
- Entwicklung eines Data Mining-Algorithmus für die Simulation
- Auswertung von Simulationsdaten mit Data Mining-Methoden
Zusammenfassung der Kapitel
Die Einleitung führt in die Themen Data Mining und Simulation ein und erläutert die Zielsetzung der Arbeit. Kapitel 2 definiert die Simulation und ihre Anwendungsbereiche, wobei die Vor- und Nachteile sowie verschiedene Simulationsarten beleuchtet werden. Das Kapitel stellt auch das Simulationsmodell James II vor, das im weiteren Verlauf der Arbeit verwendet wird. Kapitel 3 befasst sich mit Data Mining, definiert den Begriff, beschreibt die Ziele und den Prozess des Data Mining und stellt verschiedene grundlegende Methoden vor. Kapitel 4 analysiert verschiedene Vergleichskriterien für Data Mining-Werkzeuge und -Methoden, um deren Eignung für den Einsatz in der Simulation zu bewerten. Kapitel 5 analysiert verschiedene Modellierungs- und Simulationsumgebungen, Data Mining-Bibliotheken und -Werkzeuge, um deren Data Mining-Funktionalitäten zu beurteilen. Kapitel 6 vergleicht die analysierten Werkzeuge und Methoden und trifft eine Implementationsentscheidung für die in der Arbeit verwendete Data Mining-Methode. Kapitel 7 beschreibt die Implementierung des gewählten Data Mining-Algorithmus in James II. Kapitel 8 präsentiert die Auswertung von Simulationsdaten mit dem implementierten Algorithmus. Das Fazit fasst die Ergebnisse der Arbeit zusammen und diskutiert die Bedeutung der Ergebnisse für die Praxis.
Schlüsselwörter
Die Schlüsselwörter und Schwerpunktthemen des Textes umfassen Data Mining, Simulation, Modellierung, Analyse, Optimierung, Algorithmen, James II, SPSS, WEKA, R-Project, Cluster-Analyse, Simulationsdaten, und die Integration von Data Mining in Simulationsumgebungen. Die Arbeit untersucht die Möglichkeiten und Herausforderungen der Anwendung von Data Mining-Techniken zur Analyse und Optimierung von Simulationsmodellen und bewertet verschiedene Data Mining-Werkzeuge und -Methoden hinsichtlich ihrer Eignung für den Einsatz in der Simulation.
- Citation du texte
- B.Sc. Enrico Seib (Auteur), 2008, Data Mining - Methoden in der Simulation, Munich, GRIN Verlag, https://www.grin.com/document/114550
-
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X.