Das Internet ist eine gigantische Sammlung von Informationen aller Art. Von Kochrezepten bis Bombenbauplänen kann man hier fast jede Information finden...wenn man genug Geduld und Zeit aufbringt. Die pure Anzahl von Web-Sites wird für den Nutzer zu einem Problem. So meldete z.B. Yahoo im August 2005 eine Indexgröße von 19,2 Milliarden Seiten. [Rahm, S.260] Dabei ist ein erheblicher, und meist der qualitativ hochwertigere, Teil der Informationen noch nicht einmal zugänglich, da er auf Anfrage dynamisch aus Datenbeständen zusammengesucht und auf dynamisch generierten Seiten angezeigt wird. Darüber hinaus sind vielfältige Informationen derzeit in privaten Datenbanken, denen von Unternehmen oder Behörden, in digitalen Bibliotheken oder Intranets der breiten Nutzung entzogen. Diese Datenmengen in einem anderem als dem ursprünglich vorgesehenen Kontext oder in Kombination anwenden zu können, böte verschiedenste Möglichkeiten, davon zu profitieren.
Inhaltsverzeichnis
- Einführung
- Das semantische Web als Fortentwicklung des bestehenden Netzes
- Probleme bei der Etablierung eines semantischen Webs
- Lösungsansätze
- Gliederung
- Syntaktische Standards
- Hyper Text Markup Language - HTML
- Extensible Markup Language - XML
- XML-Schemata
- Ressource Description Framework - RDF
- RDF-Schemata
- Klassen
- Beziehungen
- Einschränkungen
- weitere Primitive
- Heterogenität auf struktureller und semantischer Ebene
- Heterogenitätskonflikte zwischen Datenmodellen
- Heterogenitätskonflikte zwischen Daten-Schemata
- bilaterale Konflikte
- multilaterale Konflikte
- Meta-Level Konflikte
- Heterogenitätskonflikte zwischen Daten-Instanzen
- Datenkonflikte
- Domänenkonflikte
- Semantische Integration
- Wrapper und Mediatoren
- Erfassen von Semantik über die Struktur
- structure resemblance (Ähnlichkeit)
- definition of terms (Term-Definition)
- structure enrichment (Anreicherung)
- Meta-Annotation
- Zugang über natürlichsprachliche Verarbeitung des Ursprungstextes
- Semantische Modelle
- Semantische Modelle darstellen und vergleichen
- Namen und Bezeichner
- Termnetzwerke
- Konzepthierarchien
- Ontologien
- Zusammenfassung
Zielsetzung und Themenschwerpunkte
Die Arbeit befasst sich mit der Herausforderung der semantischen Integration im Kontext des World Wide Web. Ziel ist es, die Möglichkeiten und Schwierigkeiten der Integration heterogener Informationsquellen im semantischen Web zu beleuchten. Dabei stehen insbesondere die Probleme der Heterogenität auf struktureller und semantischer Ebene im Vordergrund.
- Das semantische Web als Fortentwicklung des bestehenden Netzes
- Die Bedeutung von Informationsservices für die Integration von heterogenen Informationsquellen
- Die Herausforderungen der Heterogenität bei der semantischen Integration
- Lösungsansätze für die Integration von Semantik
- Darstellung und Vergleich semantischer Modelle
Zusammenfassung der Kapitel
Die Einführung beleuchtet die rasante Zunahme von Informationen im Internet und die damit verbundenen Herausforderungen. Der Fokus liegt auf der Notwendigkeit von Services, die einen integrierten Zugriff auf diese Daten ermöglichen, sowie auf den Problemen des aktuellen Web-Inhalts für die maschinelle Verarbeitung.
Im zweiten Kapitel werden wichtige syntaktische Standards für die Integration semantischer Inhalte vorgestellt, wie z.B. HTML, XML und RDF. Besonderer Wert wird auf die Darstellung und Integration von RDF-Schemata gelegt.
Kapitel 3 widmet sich dem Problem der Heterogenität von Daten auf struktureller und semantischer Ebene. Es werden verschiedene Arten von Heterogenitätskonflikten zwischen Datenmodellen, -Schemata und -Instanzen analysiert.
Das vierte Kapitel behandelt die semantische Integration als zentralen Ansatz zur Bewältigung der Heterogenitätsproblematik. Es werden verschiedene Ansätze zur Erfassung von Semantik über die Struktur und über die natürlichsprachliche Verarbeitung des Ursprungstextes diskutiert.
Kapitel 5 widmet sich der Darstellung und dem Vergleich verschiedener semantischer Modelle. Es werden verschiedene Ansätze, wie z.B. Namen und Bezeichner, Termnetzwerke, Konzepthierarchien und Ontologien, beleuchtet.
Schlüsselwörter
Die Arbeit konzentriert sich auf die Themen semantische Integration, Heterogenität, Datenmodelle, Daten-Schemata, Daten-Instanzen, RDF, Ontologien, Termnetzwerke, natürlichsprachliche Verarbeitung und Wissensrepräsentation im Kontext des World Wide Web. Der Fokus liegt insbesondere auf der Herausforderung der maschinellen Verarbeitung von Informationen und der Entwicklung von Methoden zur Integration von Semantik aus heterogenen Informationsquellen.
- Quote paper
- Stefan Köpke (Author), 2007, Semantische Integration, Munich, GRIN Verlag, https://www.grin.com/document/90188