Durch die Informationsflut haben die Datenmengen in den letzten Jahren rasant zugenommen. Diese Datenberge können wertvolle Informationen enthalten, die zum Verständnis von wichtigen Zusammenhängen beitragen oder die Entscheidungsträger innerhalb eines Unternehmens bei wichtigen Entscheidungen unterstützen. Nicht zu unrecht wird Wissen oftmals als vierter Produktionsfaktor oder als entscheidender Wettbewerbsfaktor bezeichnet. Doch dieses Wissen in den Datenbergen kann oft nicht oder nur unzureichend genutzt werden. Denn Daten sind nicht gleich Information, bzw. Wissen. Im Gegensatz zu den herkömmlichen Verfahren, die auf einfachen statistischen Methoden und Datenbankmanagementsystemen basieren, verbinden Data-Mining Verfahren Methoden aus den Bereichen Statistik, Maschinelles Lernen, Datenbanken und Visualisierung. Diese unterstützen den Benutzer dabei, in großen Datenbeständen verborgene und für das Unternehmen wertvolle Daten aufzufinden. Mithilfe von Data Mining können die Unternehmen quasi einen Blick in die Zukunft werfen und Ereignisse mit einer gewissen Wahrscheinlichkeit voraussagen.
In der nachfolgenden Arbeit wird zuerst in einer Einführung dargestellt, was man unter Data-Mining versteht und der Data-Mining Prozess anhand des CRISP- DM Modells erklärt. Anschließend werden die Data Mining Aufgaben und ihnen zugeordnete Methoden anhand von Beispielen veranschaulicht.
Um die große Bedeutung für die Praxis zu verdeutlichen wird danach ein Überblick der wichtigsten Anwendungsfelder gegeben. Da ein Data Mining ohne Daten unmöglich ist, muss der Zielkonflikt zwischen Data Mining und dem Datenschutz diskutiert werden, bevor in einem Fazit auf die zukünftige Bedeutung des Data Mining eingegangen wird.
Inhaltsverzeichnis
Abkürzungsverzeichnis
Abbildungsverzeichnis
1. Einführung und Inhalt der Arbeit
2. Data-Mining
2.1 Der CRISP Data Mining Prozess
2.1.1 Business Understanding
2.1.2 Data Understanding
2.1.3 Data Preperation
2.1.4 Modeling
2.1.5 Evaluation
2.1.6 Deployment
2.2 Phasen des Data Mining
3. Aufgaben und geeignete Methoden des Data Mining
3.1 Segmentierung
3.1.1 Clusteranalyse als Methode der Segmentierung
3.1.2 Beispiel: Single- Linkage Verfahren
3.2 Klassifikation
3.2.1 Entscheidungsbäume als Methode der Klassifikation
3.2.2 Fallbeispiel Werbeaktion einer Autoversicherung
3.3 Prognose
3.4 Abhängigkeitsanalyse
3.4.1 Abhängigkeitsanalyse mit Assoziationsregeln
3.4.2 Beispiel Getränketransaktionen
3.5 Abweichungsanalyse
4. Anwendungsfelder
5. Data Mining Werkzeuge
5.1 IBM Intelligent Miner
5.2 SPSS Clementine
5.3 SAS Enterprise Miner
6. Zielkonflikt Data Mining und Datenschutz
7. Fazit
Literaturverzeichnis
1. Zeitschriften/ Zeitungen
2. Bücher
3. Internetquellen
Abkürzungsverzeichnis
Abbildung in dieser Leseprobe nicht enthalten
Abbildungsverzeichnis
Abbildung 1: What main methodology are you using for data mining?
Umfrage im August 2004
www.kdnuggets.com/polls/2004/data_mining_methodology.htm vom 22.12.2004
Abbildung 2: Phases of the CRISP-DM Process Model
www.crisp-dm.org/Process/index.htm vom 16.10.2004
Abbildung 3: Skalenniveau und Datentypen
vgl. Otte, Ralf. Otte, Viktor. Kaiser, Volker. Data Mining für die industrielle Praxis. 2004.
Abbildung 4: Data Mining Aufgaben und zugeordnete Techniken
eigene Darstellung
Abbildung 5: Verfahrensklassen der Clusteranalyse
vgl. Witten, Ian H. Eibe, Frank. 2001. Data Mining. Praktische Werkzeuge und Techniken für das maschinelle Lernen. München: Hanser- Verlag.
Abbildung 6: Datenmatrix
eigene Darstellung
Abbildung 7: Abstandsmatrix 1
eigene Darstellung
Abbildung 8: Abstandsmatrix 2
eigene Darstellung
Abbildung 9: Abstandsmatrix 3
eigene Darstellung
Abbildung 10: Abstandsmatrix 4
eigene Darstellung
Abbildung 11: Beispiel eines Entscheidungsbaumes
vgl. www.dirk-loss.de vom 20.11.2004
Abbildung 12: Transaktionen
www.andre.maurer.name/documents.asp?doc=13 vom 23.11.2004
Abbildung 13: Assoziationsregeln mit Mindestsupport 50%
www.andre.maurer.name/documents.asp?doc=13 vom 23.11.2004
Abbildung 14: Anwendungsfelder des Data Mining
vgl. Wiedmann, Klaus- Peter. Buckler, Frank. Neuronale Netze im Marketing- Management; ferner www.doag.org/pub/docs/sig/dwh/2000-07/data-mining.ppt vom 12.11.2004
Abbildung 15: Marktpositionen von Data Mining Tools
Alpar, Paul. Niedereichholz, Joachim. Data Mining im praktischen Einsatz. 2000.
1. Einführung und Inhalt der Arbeit
Durch die Informationsflut haben die Datenmengen in den letzten Jahren rasant zugenommen. Diese Datenberge können wertvolle Informationen enthalten, die zum Verständnis von wichtigen Zusammenhängen beitragen oder die Entscheidungsträger innerhalb eines Unternehmens bei wichtigen Entscheidungen unterstützen. Nicht zu unrecht wird Wissen oftmals als vierter Produktionsfaktor oder als entscheidender Wettbewerbsfaktor bezeichnet[1].
Doch dieses Wissen in den Datenbergen kann oft nicht oder nur unzureichend genutzt werden. Denn Daten sind nicht gleich Information, bzw. Wissen. Im Gegensatz zu den herkömmlichen Verfahren, die auf einfachen statistischen Methoden und Datenbankmanagementsystemen basieren, verbinden Data-Mining Verfahren Methoden aus den Bereichen Statistik, Maschinelles Lernen, Datenbanken und Visualisierung[2]. Diese unterstützen den Benutzer dabei, in großen Datenbeständen verborgene und für das Unternehmen wertvolle Daten aufzufinden. Mithilfe von Data Mining können die Unternehmen quasi einen Blick in die Zukunft werfen und Ereignisse mit einer gewissen Wahrscheinlichkeit voraussagen[3].
In der nachfolgenden Arbeit wird zuerst in einer Einführung dargestellt, was man unter Data-Mining versteht und der Data-Mining Prozess anhand des CRISP- DM Modells erklärt.
Anschließend werden die Data Mining Aufgaben und ihnen zugeordnete Methoden anhand von Beispielen veranschaulicht.
Um die große Bedeutung für die Praxis zu verdeutlichen wird danach ein Überblick der wichtigsten Anwendungsfelder gegeben. Da ein Data Mining ohne Daten unmöglich ist, muss der Zielkonflikt zwischen Data Mining und dem Datenschutz diskutiert werden, bevor in einem Fazit auf die zukünftige Bedeutung des Data Mining eingegangen wird.
2. Data-Mining
Der Begriff Data-Mining lässt sich vom Englischen „to mine“ = „schürfen nach“ ableiten. Unter Data- Mining versteht man wörtlich übersetzt das Schürfen in Massendaten[4]. Häufig wird Data Mining mit dem Schürfen nach Gold verglichen, da das Wissen, das die Unternehmen mithilfe intelligenter Data Mining Methoden aus den Datenbergen gewinnen, für die Unternehmen sehr wertvoll ist.
„Data Mining ist ein Prozess zum Auffinden von unbekannten und nicht- trivialen Strukturen, Zusammenhängen und Trends in Datenbeständen[5].“ Ein erfolgreicher Data Mining Prozess liegt demzufolge nur dann vor, wenn neue und hinreichend komplexe Ergebnisse gewonnen werden[6].
2.1 Der CRISP Data Mining Prozess
Durch das CRISP-DM (Cross Industry Standard Process for Data Mining) Modell wurde im Jahr 2000 ein einheitlicher Standard für Data Mining Prozesse geschaffen. Dieses Modell wurde seit 1996 von den Firmen NCR Systems Engineering, Daimler Chrysler AG, SPSS Inc. und der niederländischen Versicherungsgruppe OHRA Verzekeringen en Bank Groep B.V. entwickelt und wird mittlerweile am häufigsten angewendet[7].
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 1: What main methodology are you using for data mining? (August 2004)
(Quelle: vgl. www.kdnuggets.com/polls/2004/data_mining_methodology.htm vom 23.12.2004)
Es gliedert einen Data-Mining Prozess in folgende sechs Phasen, die jeweils aus Aufgaben und Zwischenergebnissen bestehen:
- Business Understanding
- Data Understanding
- Data Preperation
- Modeling
- Evaluation
- Deployment[8]
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 2: Phases of the CRISP-DM Process Model (Quelle: www.crisp-dm.org/Process/index.htm vom 16.10.2004)
Dabei muss ein Data Mining Prozess als dynamischer Prozess verstanden werden, weshalb die Phasen nicht nacheinander abgearbeitet werden, sondern zwischen den Phasen hin- und hergesprungen wird[9]. Das CRISP-DM Modell legt dabei den Fokus nicht auf den technischen, sondern hauptsächlich auf den betriebswirtschaftlichen Bereich. Im weiteren Verlauf dieses Kapitels werden die einzelnen Phasen des Modells genauer erläutert.
2.1.1 Business Understanding
Dass die Fokussierung im betriebswirtschaftlichen Bereich liegt, wird schon in der ersten Phase, dem Business Understanding deutlich erkennbar.
Hier werden die betriebswirtschaftlichen Projektziele aus der Sicht der Fachabteilung festgelegt. Außerdem muss abgeschätzt werden, welche Daten und Ressourcen im Unternehmen für die Analyse vorhanden sind[10]. Besonders schwierig ist dies für ein Unternehmen, das sich erstmalig entscheidet, Problemstellungen mithilfe von Data Mining Techniken zu lösen. Diese Unternehmen können die Qualität ihrer Daten nicht oder nur schlecht einschätzen und sind oftmals der Meinung, dass sich diese nicht für Data Mining Auswertungen eignen. Allerdings ist diese Angst unbegründet, denn selbst fehlerhafte und lückenhafte Datenbestände können mithilfe der robusten Data Mining Techniken untersucht werden.
Des weiteren müssen in dieser Phase die Erfolgskriterien festgelegt und die zur Verfügung stehenden Mittel abgeschätzt werden. Hierbei muss auch überlegt werden, ob im Unternehmen ein eigenes Data Mining Werkzeug implementiert wird, bzw. bereits vorhanden ist, oder ob das Projekt einem externen Data Mining Dienstleister übergeben wird[11]. Um zu gewährleisten, dass die Ziele erreicht werden, muss in dieser Phase außerdem ein Projektplan erstellt werden, indem der zeitliche Ablauf dargestellt wird und außerdem die benötigten Tools und Techniken fixiert werden.
[...]
[1] vgl. Wittmann, Thomas. Hunscher, Matthias. Kischka, Peter. Ruhland, Johannes. Data Mining. Entwicklung und Einsatz robuster Verfahren für betriebswirtschaftliche Anwendungen. 2000.
[2] vgl. kd.cs.uni-magdeburg.de/data-mining-ueberblick.pdf vom 14.10.2004
[3] vgl. Schausten, Jutta. Blick in die Zukunft. e-commerce Magazin 03/ 2004.
[4] vgl. Lusti, Markus. Data Warehousing und Data Mining. 2002.
[5] Otte, Ralf. Otte, Viktor. Kaiser, Volker. Data Mining für die industrielle Praxis. 2004
[6] vgl. Otte, Ralf. Otte, Viktor. Kaiser, Volker. Data Mining für die industrielle Praxis. 2004.
[7] vgl. www.crisp-dm.org vom 16.10.2004
[8] vgl. www.crisp-dm.org vom 16.10.2004
[9] vgl. Schausten, Jutta. Blick in die Zukunft. e-commerce magazin 03/2004
[10] vgl. www.absatzwirtschaft.de vom 18.11.2004
[11] vgl. www.ipd.uni-karlsruhe.de/~ovid/Seminare/DWVSS03/ Vortraege/OVID-DWVSS03%20-%20KDD%20und%20Data%20Mining.pdf vom 20.11.2004
- Citar trabajo
- Diplom-Betriebswirtin (FH) Sandra Feist (Autor), 2005, Data Mining als Hilfsmittel für gezielte Datensuche, Múnich, GRIN Verlag, https://www.grin.com/document/70663
-
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X.