Diese Seminararbeit befasst sich mit dem Thema Data Mining und verfolgt das Ziel, eines Einblicks in die Thematik, deren Umfang und einen Ausblick auf die sich ergebenden Möglichkeiten zu geben. Gerade durch die wachsende Menge an anfallenden Daten in Unternehmen, aber auch dank das Wachstum des Webs, sowie die große Popularität von Social Media Plattformen, gewinnt diese Form der Datenanalyse immer mehr an Bedeutung. Wo Data Mining früher nur für große Unternehmen interessant war, ist dieses heutzutage auch für mittelständische Unternehmen ein Begriff.
Nach einer kurzen Definition von Data Mining erfolgt die Einordnung in den KDD-Prozess (Knowledge Discovery in Databases) sowie eine knappe Abgrenzung zu OLAP (On-Line Analytical Processing). Darauf folgt eine Erläuterung des Data Warehouse, welches die zumeist verwendete Datenbasis beim Data Mining ist und im Anschluss daran werden die Standard Methoden des Data Mining sowie zwei spezielle Abwandlungen, das Text Mining und das Webmining erläutert.
Inhaltsverzeichnis
- Einleitung
- Motivation
- Aufbau
- Grundlagen
- Definition von Data Mining
- KDD - Knowledge Discovery in Databases
- OLAP in Abgrenzung zum Data-Mining
- Data Warehouse
- Data Mining
- Unterteilung der Data Mining Ziele
- Data Mining Methoden
- Spezielle Data Mining Methoden
- Text Mining
- Webmining
- Fazit und Ausblick
Zielsetzung und Themenschwerpunkte
Diese Seminararbeit behandelt das Thema Data Mining und zielt darauf ab, Einblicke in die Thematik, ihren Umfang und die sich ergebenden Möglichkeiten zu vermitteln. Der Fokus liegt auf der wachsenden Bedeutung von Data Mining in Unternehmen, insbesondere angesichts des stetigen Anstiegs der Datenmenge, der Bedeutung des Web und der Popularität von Social-Media-Plattformen.
- Definition und Einordnung von Data Mining
- Der KDD-Prozess und seine Beziehung zu Data Mining
- Abgrenzung von Data Mining zu OLAP
- Die Rolle des Data Warehouse im Data Mining
- Standard-Methoden des Data Mining und ihre Anwendung
Zusammenfassung der Kapitel
- Einleitung: Dieses Kapitel stellt das Thema Data Mining vor und beleuchtet seine Bedeutung im Kontext der zunehmenden Datenmengen in Unternehmen, dem Web und Social Media. Es skizziert auch den Aufbau der Seminararbeit.
- Grundlagen: Dieses Kapitel definiert Data Mining und ordnet es in den KDD-Prozess (Knowledge Discovery in Databases) ein. Es befasst sich mit der Abgrenzung zu OLAP (On-Line Analytical Processing) und erläutert das Data Warehouse als wichtige Datenbasis für Data Mining.
- Data Mining: Dieses Kapitel widmet sich den Zielen, Methoden und spezifischen Techniken des Data Mining. Es behandelt unter anderem die Unterteilung der Data Mining-Ziele, verschiedene Data Mining-Methoden und zwei Spezialisierungen: Text Mining und Webmining.
Schlüsselwörter
Data Mining, Knowledge Discovery in Databases (KDD), On-Line Analytical Processing (OLAP), Data Warehouse, Text Mining, Webmining, Datenanalyse, Mustererkennung, Algorithmen, Wissensschaffung.
Häufig gestellte Fragen
Was ist Data Mining?
Data Mining ist die systematische Anwendung von Methoden zur Entdeckung von Mustern, Trends und Wissen in großen Datenmengen.
Was ist der KDD-Prozess?
KDD steht für „Knowledge Discovery in Databases“. Data Mining ist ein zentraler Teilschritt innerhalb dieses Prozesses zur Gewinnung von Erkenntnissen aus Daten.
Wie unterscheidet sich Data Mining von OLAP?
Während OLAP (On-Line Analytical Processing) eher der deskriptiven Abfrage bekannter Daten dient, sucht Data Mining nach bisher unbekannten Zusammenhängen.
Was versteht man unter Text Mining und Webmining?
Text Mining analysiert unstrukturierte Texte, während Webmining Informationen aus der Struktur, den Inhalten und der Nutzung des World Wide Web extrahiert.
Warum wird ein Data Warehouse im Data Mining genutzt?
Ein Data Warehouse dient als zentrale, bereinigte Datenbasis, die speziell für analytische Zwecke und großflächige Auswertungen optimiert ist.
- Quote paper
- Anonym (Author), 2015, Data-Mining. Erkenntnisgewinn aus Datenanalyse, Munich, GRIN Verlag, https://www.grin.com/document/418160