Heutzutage müssen Unternehmen, besonders jene mit viel Kundenverkehr, mit einer großen Menge an Daten haushalten. Diese zum Teil riesige Datenmenge hat das Potential nützliche Informationen für das Unternehmen zu enthalten. Data Mining bedeutet wörtlich übersetzt ‚das Schlürfen in Messdaten‘ was mit dem Schürfen nach Gold verglichen werden kann, da extrahierte Information aus einer Datenmenge für das Unternehmen sehr Wertvoll sein kann. Aus einem Datenberg entsteht Wissen. Daher wird für Data Mining auch der Begriff Knowledge Mining verwendet.
Data Mining kann als systematischer, kreativer Prozess angesehen werden, der im Arbeitsfortschritt den Datenbestand nach Regelmäßigkeiten, Mustern, Strukturen, Abweichungen und Beziehungen sowie gegenseitigen Korrelationen jeglicher Art untersucht.1 Dazu verbindet Data Mining Methoden aus der Statistik, dem Maschinellem Lernen, der Datenbanken und der Visualisierung.
Inhaltsverzeichnis
- Was ist Data Mining
- Gründe für die Verbreitung des Data Minings
- Anwendungsgebiete
- Der Supermarkt als Informationsbroker
- Das könnte Sie interessieren! Empfehlungen als direktes Marketing
- Gute und Schlechte Kunden
- Ablauf des Data Mining Prozesses
- CRISP-Data Mining
- Business Understanding
- Data Understanding
- Data Preparation
- Modeling
- Evaluation
- Deployment
- Methoden des Data Mining
- Klassifikation
- Segmentierung
- Prognose
- Korrelationsanalysen
- Abweichungsanalyse
- Die Wichtigsten Techniken des Data Minings
- Decision Trees
- Clustering
- K-Means
- Neuronale Netze
- Data Mining Tools
- Implementierung
- Data Understanding
- Forstbestand
- Gasthaus
- Brustkrebsuntersuchung
- Data Preparation
- Forstbestand
- Gasthaus
- Brustkrebsuntersuchung
- Modeling
- Forstbestand
- Gasthaus
- Brustkrebsuntersuchung
- Evaluation
- Forstbestand
- Gasthaus
- Brustkrebsuntersuchung
- Deployment
- Open Source Programme
- WEKA
- Modeling mit WEKA
- Rapid Miner
- Vergleich
- Aussicht
Zielsetzung und Themenschwerpunkte
Diese Arbeit befasst sich mit der Theorie und Praxis des Data Mining. Ziel ist es, die grundlegenden Konzepte, Methoden und Anwendungen des Data Mining zu erläutern und anhand von Beispielen zu veranschaulichen. Die Arbeit beleuchtet verschiedene Data-Mining-Techniken und zeigt deren Anwendung in unterschiedlichen Kontexten.
- Grundlagen des Data Mining und dessen Anwendungsgebiete
- Der Data Mining Prozess nach CRISP-DM
- Wichtige Methoden des Data Mining (Klassifikation, Clustering, Prognose)
- Anwendung von Data Mining in verschiedenen Bereichen (Marketing, Sicherheit)
- Vergleich verschiedener Data Mining Tools
Zusammenfassung der Kapitel
Kapitel 1 führt in das Thema Data Mining ein, erklärt den Begriff und beschreibt die Gründe für dessen zunehmende Verbreitung. Kapitel 2 erläutert den Ablauf des Data Mining Prozesses nach CRISP-DM. Kapitel 3 präsentiert verschiedene Methoden des Data Mining, während Kapitel 4 die wichtigsten Techniken detaillierter beschreibt. Kapitel 5 gibt einen Überblick über verfügbare Data Mining Tools. Kapitel 6 beschreibt eine Implementierung anhand von Fallbeispielen, wobei die Kapitel 6.1 bis 6.4 die Phasen Data Understanding, Data Preparation, Modeling und Evaluation der Fallbeispiele behandeln.
Schlüsselwörter
Data Mining, Knowledge Mining, CRISP-DM, Klassifikation, Clustering, Prognose, Korrelationsanalyse, Abweichungsanalyse, Decision Trees, Neuronale Netze, Data Mining Tools, Marketing, Sicherheitsanwendungen.
- Quote paper
- Carl-Niklas Wentzel (Author), 2009, Data Mining - Theorie und praktische Anwendungen, Munich, GRIN Verlag, https://www.grin.com/document/122056