Das unternehmensweite Data Warehouse bietet die Lösung eines umfassenden Informationsmanagements auf Basis des Information Retrievals. In diesem Zusammenhang sind Verfahren des Knowledge Discovery in Databases (Data Mining, Datenvisualisierung) von großer Bedeutung und essentiell für entscheidungsunterstützende Prozesse, da in gigantischen Datenmengen durch traditionell mathematisch-statistische Methoden, sowie durch Techniken der informationstheoretischen Kybernetik nach Informationen gesucht wird, aus denen im weiteren Wissen extrahiert wird.
In dieser Arbeit wird Ein Fuzzy Approach im Information Retrieval vorgestellt, der ein innovatives Verfahren darstellt, um vage bzw. ungenaue Daten, die in Form von Präferenz-Intervallen vorliegen, zur Wissensextraktion zu verwenden. Der neue Ansatz kombiniert die entscheidenden Theorien zur Behandlung unscharfer Daten und Mengen, Rough Sets und Fuzzy Sets, und extrahiert Zielintervalle, die einer approximativen Abbildung der Eingabedaten entsprechen. Aus diesen Rough Intervals werden Regeln formuliert, die als Regelbasis in wissensbasierten Systemen zur automatischen Entscheidungsunterstützung verwendet werden können.
In Kapitel 2 wird der Begriff des Information Retrieval in seinen Facetten erfaßt und klassifiziert. Dabei werden die unterschiedlichen Datenstrukturen, die Verfahren zur Indexierung von Dokumenten, sowie die Suchtechniken im Information Retrieval, verbunden mit den verschiedenartigen Computer-Informationssystemen, berücksichtigt. Dieser Teil versucht zudem, anhand der Entwicklung des elektronischen Information Retrievals den Bedarf und die Entstehung des heutigen Data Warehouse zu verdeutlichen.
Kapitel 3 betrachtet informationstheoretische Aspekte im Zusammenhang mit dem neuen Medium Internet, sowie die wachsende Informationsglobalisierung und die Problematiken der daraus resultierenden, exponentiell wachsenden Informationsmenge.
[...]
Inhaltsverzeichnis
- Einleitung
- Aspekte des Information Retrieval
- Definition und Abgrenzung
- Datenstrukturen in Informationssystemen
- Hashbasierte und Intervallbasierte Datenstrukturen
- Signature Files und Inverted Files
- Verfahren zur Indexierung von Dokumenten
- Suchtechniken im Information Retrieval
- Boolesches Retrieval
- Fuzzy Retrieval
- Vektorraum-Modell
- Probabilistisches Retrieval
- Typologie von Informationssystemen
- Information Retrieval Systeme
- Datenbankmanagementsysteme
- Expertensysteme
- Werkzeuge für Expertensysteme
- Weitere Informationssysteme
- Der Einsatz von Information
- Internet - Entwicklung und Wachstum
- Information Overload
- Information Overload im Unternehmen
- Vom Information Retrieval zum Information Overload
- Information Overload im Internet
- Die Data Warehouse-Technologie
- Einführung
- Definition
- Entwicklung der Data Warehouse-Technologie
- Data Warehouse Konzepte
- Data Warehouse Modell der META Group
- Data Warehouse Funktionen nach SINGH
- Datenverarbeitung im Data Warehouse
- Transaction Processing und OLTP
- Decision Support Processing
- Online Analytical Processing (OLAP)
- Data Warehouse und Data Marts
- Data Warehouse Reifemodell
- Data Warehousing in der Praxis
- Verfahren des Data Mining
- Einleitung
- Definition
- Knowledge Discovery in Databases (KDD)
- Prozeßmodelle
- Methoden und Muster
- Muster
- Methoden
- Klassifikation
- Schätzung
- Vorhersage
- Ähnlichkeitsgruppierung
- Clustering
- Deskription
- Techniken
- Fallbasiertes Schließen
- Entscheidungsbaumverfahren
- Analyse von Beziehungen zwischen Datensätzen
- Automatische Clusteranalyse
- Genetische Algorithmen
- Neuronale Netze
- Visualisierung
- Data Mining-spezifische Problematiken
- Datenprobleme
- Prozeẞprobleme
- Data Mining im Unternehmen
- Corporate Intranets
- Anwendungen in der Praxis
- Ein Fuzzy Approach im Information Retrieval
- Verarbeitung unscharfer Daten
- Rough Sets
- Allgemein
- Rough Set-Theorie
- Fuzzy Logic
- Allgemein
- Entwicklungsüberblick
- Fuzzy Sets
- Possibilität versus Probabilität
- Approximatives Schließen
- Fuzzy Systeme
- Rough Sets
- Entwicklung eines Fuzzy Approachs
- Allgemein
- Konzept
- Realisierung
- Verarbeitung unscharfer Daten
- Die Implementierung eines Prototypen in C++
- Allgemeine Programmbeschreibung
- Klassen und Methoden
- Input/Output Schnittstelle
- Ein Musterbeispiel
- Berechnung multipler Kategorie -Dependenzen
- Zusammenfassung und Schlußbetrachtung
Zielsetzung und Themenschwerpunkte
Diese Diplomarbeit befasst sich mit der Anwendung eines Fuzzy Approachs im Information Retrieval. Ziel der Arbeit ist es, die Herausforderungen des Information Overloads im Kontext von modernen Informationssystemen zu analysieren und einen Lösungsansatz basierend auf Fuzzy Logic zu entwickeln.
- Information Overload und seine Auswirkungen
- Data Warehouse-Technologie und ihre Rolle im Information Retrieval
- Data Mining-Verfahren und ihre Bedeutung für die Analyse großer Datenmengen
- Fuzzy Logic und ihre Anwendung im Information Retrieval
- Entwicklung eines Prototypen zur Implementierung eines Fuzzy Approachs
Zusammenfassung der Kapitel
Die Arbeit beginnt mit einer Einführung in das Information Retrieval und behandelt verschiedene Aspekte, wie z.B. Definition, Datenstrukturen, Indexierung, Suchtechniken und Typologien von Informationssystemen. Anschließend wird das Problem des Information Overloads beleuchtet, insbesondere im Kontext von Unternehmen und dem Internet.
Kapitel 4 beschäftigt sich mit der Data Warehouse-Technologie und erläutert deren Entwicklung, Konzepte, Funktionen und Anwendungen. Kapitel 5 behandelt Verfahren des Data Mining, darunter Definition, Prozeßmodelle, Methoden, Muster, Techniken und spezifische Problematiken.
Kapitel 6 fokussiert auf die Anwendung eines Fuzzy Approachs im Information Retrieval, wobei die Verarbeitung unscharfer Daten mit Hilfe von Rough Sets und Fuzzy Logic im Vordergrund steht. Kapitel 7 beschreibt die Implementierung eines Prototypen in C++ und beleuchtet die allgemeinen Programmbeschreibung, Klassen und Methoden, die Input/Output Schnittstelle und ein Musterbeispiel.
Schlüsselwörter
Information Retrieval, Fuzzy Logic, Data Warehouse, Data Mining, Information Overload, Rough Sets, Fuzzy Sets, Prototypenentwicklung, C++.
- Quote paper
- Lucian Rehm (Author), 1999, Ein Fuzzy Approach im Information Retrieval, Munich, GRIN Verlag, https://www.grin.com/document/1066