Einleitung
“The greatest problem of today is how to teach people to ignore the irrelevant, how to refuse to know things, before they are suffocated. For too many facts are as bad as none at all.”
(W.H. Auden)
Die heutzutage im Internet vorhandene enorme und immer noch rapide anwachsende Datenmenge macht es einem Benutzer, der auf der gezielten Suche nach Informationen ist, nahezu unmöglich, sinnvoll relevante Informationen zu suchen bzw. zu finden. In der Regel wird er entweder keine der gesuchten Informationen erhalten oder aber so
viele, daß ein Rausfiltern der tatsächlich gewünschten Informationen aus den redundanten Informationen einen enormen Zeitaufwand darstellt. Das alleinige Vorhandensein einer Fülle von Informationen/Datenmengen hilft dem Anwender demnach noch nicht, Informationen leichter und/oder schneller zu finden, als dies mit
alt hergebrachten Methoden möglich war. Es ist somit notwendig, Systeme zu entwickeln, die den Anwender sinnvoll bei seiner Informationssuche unterstützen, ohne ihn in einer unkontrollierten Informationsflut ersticken zu lassen.
[...]
Inhaltsverzeichnis
- Einleitung
- Motivation
- Zielsetzung
- Gliederung
- Grundlagen
- Datamining: Data Mining
- Regeln
- Klassifikationsregeln
- Charakteristische Regeln
- Regressionsregeln
- Assoziationsregeln
- Cluster
- Information Retrieval
- Standardverfahren
- Boolesches Retrieval
- Fuzzy Retrieval
- Vektorraummodell
- Cluster-Retrievalverfahren
- Probabilistische IR-Verfahren
- Software-Agenten
- LAW: A learning Apprentice for the WWW
- Syskill & Webert
- Letizia
- WebWatcher
- Selbstorganisierende Merkmalskarten
- WEBSOM
- Multidimensionale Skalierung
- MDS nach dem Verfahren von Kruskal
- MDS nach dem SMACOF-Verfahren
- Standardverfahren
- Eigener Ansatz
- Szenario
- Dokumentbearbeitung
- Anforderungen an einen Stoppvektor
- Anforderungen an einen Thesaurus
- Generierung von Dokumentenvektoren
- Dokumentenkartenerstellung
- Simulation
- Dokumentbearbeitung
- Generierung eines Stoppvektors
- Generierung eines Thesaurus
- Generierung eines Dokumentenvektors
- Dokumentenkartenerstellung
- Definition eines Ahnlichkeitsmaßes
- Anordnung der Dokumente nach dem CARD-Algorithmus
- Anordnung der Dokumente mit NIDS-Algorithmen
- Anordnung nach dem Verfahren von Kruskal
- Anordnung nach dem SMACOF-Verfahren
- Dokumentbearbeitung
- Softwarestruktur
- Implementierung der Dokumentbearbeitung mit ACCESS
- Generierung des Stoppvektors
- Generierung eines Thesaurus
- Erstellung des Dokumentvektors
- Implementierung der Dokumentenkartenerstellung mit JAVA
- Basismethoden
- Der CARD-Algorithmus
- Der MDS-Algorithmus nach Kruskal
- Der MDS-Algorithmus nach der SMACOF-Methode
- Implementierung der Dokumentbearbeitung mit ACCESS
- Diskussion und Ausblick
- Vergleich der Dokumentenkartenerstellungs-Algorithmen
- Anhang A: Programm zur Generierung eines Thesaurus
- Anhang B: Programm zur Generierung eines Dokumentvektors
- Anhang C: Programm zur Dokumentenkartenerstellung
- Anhang D: Ergebnisdaten für Testanordnungen
- Anhang E: Die CD-ROM
- Literaturverzeichnis
Zielsetzung und Themenschwerpunkte
Diese Diplomarbeit widmet sich der adaptiven Informationssuche im Internet. Das Ziel ist die Implementierung eines Verfahrens, das die bei der Informationssuche im WWW auftretenden Probleme minimiert. Insbesondere soll das Verfahren in der Lage sein, den Inhalt von Dokumenten zu erkennen, ähnliche Dokumente zu identifizieren und die Dokumente übersichtlich zu präsentieren.
- Information Retrieval (IR) Verfahren
- Adaptive Informationssuche
- Dokumentenvisualisierung
- Ähnlichkeitsmaße für Dokumente
- Anordnungsalgorithmen für Dokumentenvektoren
Zusammenfassung der Kapitel
Kapitel 2 bietet einen Überblick über verschiedene Verfahren zur Informationssuche in großen Datenbeständen, mit Schwerpunkt auf ausgewählten Verfahren aus den Bereichen des maschinellen Lernens, der künstlichen Intelligenz, der künstlichen neuronalen Netze, des Information Retrieval und der multivariaten Analysemethoden. Das Kapitel beleuchtet insbesondere die Problematik der textbasierten Informationssuche und stellt verschiedene Standardverfahren des Information Retrieval vor.
Kapitel 3 skizziert das zu implementierende Modell zur adaptiven Informationssuche im Internet. Es beschreibt die als Testumgebung ausgewählten Daten sowie die für die Implementierung zu leistende Vorarbeit und die dabei auftretenden Probleme.
Kapitel 4 beschreibt detailliert das implementierte Modell anhand der einzelnen Entwicklungsphasen und präsentiert die erzielten Ergebnisse. Es erläutert die Generierung eines Stoppvektors und eines Thesaurus, die Bildung von Dokumentenvektoren und die Anordnung der Dokumentvektoren auf einer Dokumentenkarte anhand verschiedener Algorithmen.
Kapitel 5 gibt einen Überblick über die Implementierungsdetails anhand der jeweils verwendeten Software. Es beschreibt die Implementierung der Dokumentenbearbeitung mit ACCESS und die Implementierung der Dokumentenkartenerstellung mit JAVA.
Schlüsselwörter
Die Schlüsselwörter und Schwerpunktthemen des Textes umfassen die adaptive Informationssuche im Internet, Information Retrieval (IR) Verfahren, Dokumentenvisualisierung, Ähnlichkeitsmaße für Dokumente, Dokumentenvektoren, Stoppworte, Thesaurus, Cluster-Algorithmen, Multidimensionale Skalierung (MDS), CARD-Algorithmus, WEBSOM, SMACOF, ACCESS und JAVA.
- Citar trabajo
- Sabrina Schulze (Autor), 2000, Adaptive Informationssuche im Internet, Múnich, GRIN Verlag, https://www.grin.com/document/160
-
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X.