Das Internet ist eine gigantische Sammlung von Informationen aller Art. Von Kochrezepten bis Bombenbauplänen kann man hier fast jede Information finden...wenn man genug Geduld und Zeit aufbringt. Die pure Anzahl von Web-Sites wird für den Nutzer zu einem Problem. So meldete z.B. Yahoo im August 2005 eine Indexgröße von 19,2 Milliarden Seiten. [Rahm, S.260] Dabei ist ein erheblicher, und meist der qualitativ hochwertigere, Teil der Informationen noch nicht einmal zugänglich, da er auf Anfrage dynamisch aus Datenbeständen zusammengesucht und auf dynamisch generierten Seiten angezeigt wird. Darüber hinaus sind vielfältige Informationen derzeit in privaten Datenbanken, denen von Unternehmen oder Behörden, in digitalen Bibliotheken oder Intranets der breiten Nutzung entzogen. Diese Datenmengen in einem anderem als dem ursprünglich vorgesehenen Kontext oder in Kombination anwenden zu können, böte verschiedenste Möglichkeiten, davon zu profitieren.
Inhalt
1. Einführung
1.1 Das semantische Web als Fortentwicklung des bestehenden Netzes
1.2 Probleme bei der Etablierung eines semantischen Webs
1.3 Lösungsansätze
1.4 Gliederung
2. Syntaktische Standards
2.1 Hyper Text Markup Language - HTML
2.2 Extensible Markup Language - XML
2.3 XML-Schemata
2.4 Ressource Description Framework - RDF
2.5 RDF-Schemata
2.5.1 Klassen
2.5.2 Beziehungen
2.5.3 Einschränkungen
2.5.1 weitere Primitive
3. Heterogenität auf struktureller und semantischer Ebene
3.1 Heterogenitätskonflikte zwischen Datenmodellen
3.2 Heterogenitätskonflikte zwischen Daten-Schemata
3.2.1 bilaterale Konflikte
3.2.2 multilaterale Konflikte
3.2.3 Meta-Level Konflikte
3.3 Heterogenitätskonflikte zwischen Daten-Instanzen
3.3.1 Datenkonflikte
3.3.2 Domänenkonflikte
4. Semantische Integration
4.1 Wrapper und Mediatoren
4.2 Erfassen von Semantik über die Struktur
4.2.1 structure resemblance (Ähnlichkeit)
4.2.2 definition of terms (Term-Definition)
4.2.3 structure enrichment (Anreicherung)
4.2.4 Meta-Annotation
4.3 Zugang über natürlichsprachliche Verarbeitung des Ursprungstextes
4.4 Semantische Modelle
5. Semantische Modelle darstellen und vergleichen
5.1 Namen und Bezeichner
5.2 Termnetzwerke
5.3 Konzepthierarchien
5.4 Ontologien
6. Zusammenfassung
7. Glossar
8. Literatur
1. Einführung
Das Internet ist eine gigantische Sammlung von Informationen aller Art. Von Kochrezepten bis Bombenbauplänen kann man hier fast jede Information finden...wenn man genug Geduld und Zeit aufbringt. Die pure Anzahl von Web-Sites wird für den Nutzer zu einem Problem. So meldete z.B. Yahoo im August 2005 eine Indexgröße von 19,2 Milliarden Seiten. [Rahm, S.260] Dabei ist ein erheblicher, und meist der qualitativ hochwertigere Teil der Informationen noch nicht einmal zugänglich, da er auf Anfrage dynamisch aus Datenbeständen zusammengesucht und auf dynamisch generierten Seiten angezeigt wird. Darüber hinaus sind vielfältige Informationen derzeit in privaten Datenbanken, denen von Unternehmen oder Behörden, in digitalen Bibliotheken oder Intranets der breiten Nutzung entzogen. Diese Datenmengen in einem anderem als dem ursprünglich vorgesehenen Kontext oder in Kombination anwenden zu können, böte verschiedenste Möglichkeiten, davon zu profitieren.
1.1 Das semantische Web als Fortentwicklung des bestehenden Netzes
Die Verfügbarkeit einer kritischen Masse an Information, deren Integration einen echten Mehrwert darstellt, zum anderen die Unübersehbarkeit und Unübersichtlichkeit der vorhandenen Informationsquellen, deren getrennte Handhabung für einen Einzelnen unzumutbar wird, begründen demzufolge eine zunehmende Bedeutung von Services die eine Art "integrierten Zugriff" anbieten. Die Bereitstellung eines einheitlichen Zugriffs auf die beschriebene Menge von heterogenen, autonomen und verteilten Informationsquellen und die automatische Verarbeitbarkeit der vorgefundenen Informationen ist Voraussetzung für Web-Services aller Art, für Anwendungen in e-commerce-, e-banking-, e-learning- und anderen Bereichen und wird als Information Sharing bezeichnet.
Derzeit wird der größte Teil des Web-Inhalts in Hinblick auf menschliche Nutzung bereit- und dargestellt. Der Nutzer muß die vorgefundene Information sichten, bewerten und ggf. selbständig mit Informationen aus anderen Quellen verknüpfen. Die Aktivitäten des Nutzers werden, abgesehen von verschiedenen Suchmaschinen, kaum von Software-Tools unterstützt. Der Nutzer steht daher vor folgenden Problemen [Anton]:
- große Anzahl von Suchergebnissen (Treffer) bei geringer Präzision/ Relevanz [15]
- keine oder wenige Treffer
- Die Suchergebnisse sind stark vom Vokabular abhängig: wenn die Suchbegriffe nicht mit den Schlüsselwörtern der relevanten Dokumente übereinstimmen, werden diese nicht gefunden, obwohl sie in ihrer Bedeutung übereinstimmen.
- Es werden einzelne Web-Seiten als Suchergebnis geliefert. Ggf. müssen mehrere Anfragen gestellt, die Ergebnisse "manuell" verknüpft werden.
- Auch bei erfolgreicher Suche muß der Nutzer in den gelieferten Dokumenten die interessierende Information "manuell" herausfiltern.
- Suchergebnisse sind für andere Software-Tools kaum nutzbar.
Das Haupthindernis, um die genannten Nachteile aufzuheben, ist, daß die Bedeutung des Web-Inhalts bisher für maschinelle Verarbeitung kaum zugänglich ist.
Man versucht daher, den Web-Inhalt in einer Art darzustellen, der ihn für maschinelle Verarbeitung zugänglicher macht. Dabei muß die dargestellte Information nicht im Wortsinne vom Rechner "verstanden" werden, sondern es reicht aus, sie derart maschinell verarbeitbar zu machen, daß mit Hilfe verschiedener Software-Tools das gewünschte Ergebnis geliefert wird.
Dieses Konzept ist als semantisches Netz aktuell in aller Munde: maschinelle Helfer sollen den Nutzer bei Suche, Sichtung, Bewertung von Informationen unterstützen, indem sie den semantischen Hintergrund der dargestellten Informationen betrachten und automatisch Schlüsse ziehen. Methoden der Wissensrepräsentation und -verarbeitung sollen eine gemeinsame Nutzung von/ Zugriff auf verteilte Informationsquellen ermöglichen.
1.2 Probleme bei der Etablierung eines semantischen Webs
Als Problem erweist sich dabei die Heterogenität der Informationsquellen und die kaum strukturierte Information auf Web-Seiten. Die gemeinsame Nutzung heterogener Informationsquellen, wie z.B. Texte, Datenbanken und Ontologien, durch sog. Agenten (Software-Tools) erfordert die Zusammenführung ihrer Inhalte.
Unter dem Terminus Semantic Integration werden Forschungsansätze zusammengefaßt, die sich mit den dabei zu lösenden Problemen befassen.
Die eindeutige Darstellung der Semantik der Information in schwach strukturierter Umgebung stellt sich dabei als eine wesentliche Voraussetzung dar, um die mit der Heterogenität der Daten verbundenen Probleme zu lösen. [Stuck]
Probleme, die sich aus Heterogenität der Daten ergeben, sind von verteilten Datenbanksystemen bereits gut bekannt.
Es existieren drei Problemfelder:
- die Syntax (Datenformat) betreffend
- die Struktur (Homonyme, Synonyme oder unterschiedliche Attribute in Datenbank-Tabellen) betreffend
- die Semantik (beabsichtigte Bedeutung von Ausdrücken in speziellem Zusammenhang oder Anwendung) betreffend.
1.3 Lösungsansätze
Während es zu den ersten beiden Punkten bereits anspruchsvolle, differenzierte und ausgereifte Lösungen aus der Datenbank-Forschung gibt, befinden sich die maschinelle Erfassung und Verarbeitung der Semantik noch in einem sehr frühen Stadium. Deshalb soll im Folgenden vor allem dieser Aspekt betrachtet werden.
Das semantische Web wird kein neues System parallel zum bestehenden World Wide Web werden, sondern sich Schritt für Schritt aus ihm entwickeln. Die Entwicklung verläuft dabei auf vier Ebenen, die von technischen Aspekten eines Computernetzwerks über das Web als Interface für die Interaktion zwischen Mensch und Internet und die Wissensebene bis hin zur Anwenderebene eines Wissensnetzwerk [Zhong] im Sinne einer Basis für soziale Netzwerke reichen. Auf der dritten Ebene kann man das (semantische) Web als verteilte Datenbank bzw. Wissensbasis betrachten, deren Inhalt in maschinenlesbarer und -verarbeitbarer Weise vorliegt und von Software-Tools zur Informations-Verarbeitung und -Management automatisch verarbeitet wird und dem Nutzer Aufgaben wie Information-Suche, -Sammlung, -Klassifikation, -Filterung, -Management, -Mining, -Entdeckung und -Bewertung abnimmt.
Hierzu wird es nötig sein, den aktuellen Inhalt der Web-Dokumente um Daten über deren Semantik, sog. Metadaten zu ergänzen. Dabei ist es von Vorteil, daß die Standardisierung der Darstellung verschiedener Inhalte auf syntaktischer Ebene bereits weit fortgeschritten ist und mit Datenbank-Schnittstellen wie ODBC und Web-Standards wie HTML, XML, RDF verschiedene Standards zur Verfügung stehen, die es erlauben, unterschiedliche Informationsquellen zu integrieren. Deren Potential soll für die Integration auf semantischer Ebene genutzt werden.
1.4 Gliederung
Im folgenden Abschnitt der vorliegenden Arbeit werden deshalb diese Standards, insbesondere XML und RDF, näher betrachtet. Im dritten Abschnitt soll näher auf die verschiedenen Integrationsprobleme, die sich aus der Heterogenität auf struktureller und semantischer Ebene ergeben, eingegangen werden.
Im vierten Abschnitt werden allgemeine Lösungsmöglichkeiten für Erschließung und Integration der Semantik von Inhalten gezeigt und im fünften wird die Notwendigkeit einer eindeutigen Repräsentation der Semantik begründet und verschiedene Möglichkeiten der Repräsentation und des Vergleichs von Semantiken vorgestellt. Eine Zusammenfassung und kritische Betrachtung des aktuellen Entwicklungsstandes soll diese Arbeit abschließen.
2. Syntaktische Standards
Die maschinelle Verarbeitbarkeit von Web-Inhalten setzt voraus, daß diese maschinen-lesbar vorliegen und zwischen Software-Tools ausgetauscht werden können. Im Allgemeinen ist dies jedoch nicht der Fall. Stattdessen findet man die Daten im Web in unterschiedlichster Form. Für den Menschen im Normalfall unmittelbar les- und verstehbar, stellen sie für Maschinen zunächst einmal nur eine willkürliche Ansammlung von Zeichen dar. Erst die Definition einer Syntax gibt den Daten eine bestimmte Struktur, indem sie in formaler Weise erlaubte Konstruktionen festlegt und unerlaubte ausschließt. Daten strukturieren zu können ist eine notwendige Bedingung, um die darin verborgene Information zu erhalten, jedoch fehlt der Zugang zur eigentlichen Bedeutung der Elemente in den erkannten Strukturen, der Semantik.
Web-Inhalte werden zum gegenwärtigen Zeitpunkt vor allem für den Menschen aufbereitet und formatiert. Information, die z.B. mittels HTML ausgedrückt wird, kann vom Nutzer verstanden werden, obwohl die dafür notwendige Meta-Information (z.B. Syntax- oder Kontext-Information auf semantischer Ebene) gar nicht explizit vorliegt. Mit Metadaten kann der Sinn von Daten explizit ausgedrückt werden, sie beziehen sich also auf die Semantik. Metadaten sind Daten über Daten. Um der maschinellen Verarbeitung zugänglich zu werden, müssen sie ebenfalls geeignet strukturiert werden. Strukturierte Metadaten erlauben es, in formaler Weise strukturierten Daten eine Bedeutung zuzuweisen, Daten zu interpretieren.
Erst die Einordnung in einen bestimmten Kontext macht aus diesen Informationen im eigentlichen Sinn Wissen. Um Wissen einer bestimmten Domäne formal zu repräsentieren und prinzipiell unabhängig von Programmen wieder verwendbar zu halten, bedarf es einer weiteren Ebene, auf der Instanzen, Konzepte und ihre Beziehungen innerhalb einer Wissensdomäne formal beschrieben und Maschinen dabei unterstützt werden, Inhalte im Web interpretieren zu können, anstatt sie einfach darzustellen. Aufbau, Beschreibung und Repräsentation geeigneter Wissens-Modelle stellt daher eine weitere wichtige Herausforderung bei der Entwicklung des semantischen Webs dar. Insgesamt wurden vom World Wide Web Consortium (W3C; www.w3c.org) neun (bzw. sieben, je nach Darstellung) aufeinander aufbauende Ebene n des Software‑Designs identifiziert, auf denen schrittweise Standards mit wachsender Ausdrucksstärke zur Repräsentation von Daten und Wissen zu entwickeln und durchzusetzen sind, um, ausgehend vom derzeitigen Stand der Entwicklung und auf dessen Grundlage, ein semantisches Web zu installieren. [19] Standards und Ansätze zur und Probleme bei der Bewältigung der ersten vier bis fünf Ebenen werden in der vorliegenden Arbeit vorgestellt.
Abbildung in dieser Leseprobe nicht enthalten
2.1 Hyper Text Markup Language - HTML
Der Inhalt einer Web-Site wird derzeit vorrangig mittels HTML dargestellt. HTML ist jedoch darstellungsorientiert und unterstützt die Trennung von Dokumentinhalt und dessen Präsentation so gut wie gar nicht. Es werden ausschließlich Layout-Informationen übertragen, die vom Browser erkannt und entsprechend aufgebaut werden. Dies wird durch die Verwendung sog. tags ermöglicht, deren einheitliche Syntax standardisiert und deren Bedeutung und Interpretation vom W3C vorgegeben sind. Es wird kein Bezug zum dargestellten Inhalt hergestellt. [Anton, S.23]
Dies erlaubt zwar das freie und beliebige Darstellen jeglicher Art von Information, überläßt deren Verstehen und Interpretieren jedoch vollständig dem Nutzer.
Da HTML relativ einfach und jedermann zugänglich ist, hat es breite Akzeptanz und Verbreitung gefunden, jedoch gleichzeitig der Inhomogenität der Web-Inhalte Vorschub geleistet. Die Dokumente bestehen aus Bildern, Texten, Video- und Audiodateien. Für diese ist es schwierig, eine detaillierte Struktur anzugeben, die etwas über den Inhalt der Daten aussagt. [Rahm, S.7ff] Pflege, Verwaltung und Repräsentation der Daten, im Hinblick auf Web Services, noch mehr deren Austausch zwischen verschiedenen Anwendungen, erfordern ein Datenmodell, das Daten mit und ohne erkennbare Struktur oder inhaltlich gleiche oder ähnliche Daten mit unterschiedlicher Struktur gleichermaßen modellieren kann und somit Systeme ermöglicht, die Zugriff auf diese Daten nehmen, also den Inhalt von Web-Sites lesen und "verstehen" können. Für das semantische Web müssen nun nicht superintelligente Agenten entwickelt werden, sondern man möchte das Problem von der Seite der Informations-Darstellung angehen und zusätzlich zu Layout-Informationen Informationen über den Inhalt angeben.
2.2 Extensible Markup Language - XML
XML ist inzwischen als die Standardsprache für Web-Integrationssysteme, für die Datenrepräsentation und den Datenaustausch anzusehen. [21] Es bietet ein Format, um sowohl Datenstrukturen als auch -inhalte darzustellen. Dadurch kann es helfen, strukturierte, unstrukturiere und semistrukturierte Daten zu integrieren. [16] Wie HTML ist es eine Auszeichnungssprache, bietet aber mehr Möglichkeiten, wie z.B. nutzerdefinierte tags, die die Darstellung von Daten und Metadaten in einem Dokument ermöglichen, während gleichzeitig der Dokumenteninhalt und dessen Präsentation getrennt bleiben. Aufgrund dieser Flexibilität kann XML als Metasprache zur Definition anderer Auszeichnungssprachen verwendet werden.
Abbildung in dieser Leseprobe nicht enthalten
Zunächst war XML gedacht für die Definition von Dokumenten-Strukturen i.S. von SGML [Rahm, S. 9], später rückte die Möglichkeit, Daten auf strukturierte Art und Weise auszutauschen, in den Mittelpunkt des Interesses. Unter der Schirmherrschaft des W3C entstand ein Datenmodell, welches sich besonders gut als Austauschformat für lose gekoppelte, heterogene Systeme, insbesondere das Internet, eignet und so die zweite Ebene des Schichtenmodells des semantischen Webs bedient. [14] Einzelheiten zu Syntax, Sprachelementen und Aufbau werden vom W3C als Empfehlungen, die jedoch quasi einen Standard definieren, z.B. auf www.w3c.org publiziert. XML bietet einen einheitlichen Rahmen und Werkzeuge für den Austausch von Daten und Metadaten zwischen Anwendungen, ohne jedoch Zugriff auf die Semantik der Daten zu ermöglichen.
Ähnlich wie HTML besteht ein XML-Dokument aus in ggf. verschachtelten tags eingeschlossenem Inhalt.
Abbildung in dieser Leseprobe nicht enthalten
Ein wohlgeformtes XML-Dokument erzeugt einen Baum ineinander verschachtelter Elemente mit start- und end-tags, von denen jedes durch Attribut-Wert-Paare spezifiziert werden kann. Ein Dokument besteht mindestens aus dem Wurzel- oder Doku-ment‑Element. Der Inhalt eines Elements besteht wiederum aus Elementen, wobei Re-kursionen und Elemen-te mit mehreren Elternelementen ver-boten sind.
Jedes Element muß mit einem start- tag begin-nen und mit einem end- tag abgeschlossen werden. Die Unterscheidung zwischen Elementen und eigentlichem Inhalt ist durch die spitzen Klammern der tags gewährleistet. Die Elemente erhalten mnemonische, d.h. sinntragende Bezeichner, so daß aus ihnen die Bedeutung der Strukturierung abgelesen werden kann. Attribute bieten die Möglichkeit, Elemente mit zusätzlichen Eigenschaften zu versehen.
Da es kein vorgegebenes Vokabular bzw. keine Menge erlaubter Kombinationen gibt, kann dies für jede Anwendung mit Hilfe sog. DTDs definiert werden. DTDs beschreiben die Struktur einer Menge von ähnlichen Dokumenten und dienen auf diese Art dazu, die Standardisierung von Anwendungsdokumenten und Datenobjekten zu fördern. Sie beschreiben die tags, die ein Dokument verwenden kann, zugeschnitten auf die speziellen semantischen Anforderungen des Anwendungskontextes, und die Regeln, nach denen die tags mit ihrem Inhalt verknüpft werden. Die zusätzlichen Einschränkungen in einer DTD beziehen sich auf die logische Struktur des Dokumentes, was insbesondere die erlaubten/verbotenen Verschachtelungen von tags beinhaltet sowie Beschränkungen, die Attributtypen und default-Werte von Attributen betreffen. Um den Mängeln der DTD beim Modellieren von komplexeren Daten zu begegnen, hat das W3C eine XML-Schemaspezifikation entwickelt, die Funktionalitäten bietet, die über die von DTDs hinausgehen.
2.3 XML-Schemata
XML-Schemata unterstützen z.B. Datentypen und das Modellieren von Beziehungen und Einschränkungen. [14][16][17]
Ein Datenobjekt gilt als XML-Dokument, wenn es den von W3C herausgegebenen Richtlinien für wohlgeformte Dokumente entspricht. Diese Spezifikation gibt eine formale Grammatik vor, die in solchen wohlgeformten Dokumenten verwendet wird. Demnach besteht ein XML-Dokument aus einer dreiteiligen Struktur: dem Prolog, dem Wurzelelement (als Stellvertreter des darunter liegenden Baums) und, optional, einem Epilog mit weiteren Informationen. Im Prolog werden Angaben über die verwendete XML-Version und die Grammatik der Elemente (DTD) angegeben. Fehlt der Prolog, ist das Dokument zwar wohlgeformt, jedoch nicht gültig. Ein XML-Dokument ist dann gültig, wenn es eine zugehörige Typ-Definition besitzt und die grammatikalischen Einschränkungen dieser Definition erfüllt.
Da XML-Schemata einen viel verständlicheren Weg darstellen, die Struktur eines XML Dokumentes zu definieren, haben sie DTDs weitgehend abgelöst. Ein XML-Schema ist selbst XML-Dokument und beschreibt eine gültige Struktur eines XML-Dokuments i.S. einer DTD. Elemente, die in einer Schema-Definition benutzt werden, sind vom Typ "element" und haben Attribute, die die genannten Beschränkungen definieren. Die Information innerhalb eines solchen Elements ist eine einfache Liste von weiteren Element-Definitionen, die in dem definierten Element verschachtelt sein müssen
Darüber hinaus verfügen XML-Schemata über weitere nützliche features zur Datenstruktur-Definition: Sie unterstützen Basisdatentypen und lassen Einschränkungen auf Attributen (z.B Ereignis-Einschränkungen) zu, bieten hoch entwickelte Strukturen (z.B. abgeleitete Definitionen durch Erweiterung oder Einschränkung anderer Definitionen) und einen Namensraum-Mechanismus, der die Kombination verschiedener Schemata erlaubt, so daß Informationen aus unterschiedlichen Quellen ohne Namenskonflikte genutzt werden können, indem durch Voranstellen von Präfixen die Eindeutigkeit der Elementtypen gewährleistet bleibt. [Anton , S.43 ff.]
Insgesamt ermöglichen diese features es, relativ komplexe Datenstrukturen zu kodieren und Datenmodelle von Anwendungen, deren Information gemeinsam genutzt werden sollen, auf XML-Schemata abzubilden. Somit kann die Information in Ausdrücken eines XML-Dokuments kodiert und (in Verbindung mit dem XML-Schema-Dokument) über das Internet zugänglich gemacht werden. Es ist jedoch wichtig zu betonen, daß eine solche Spezifikation lediglich syntaktische Konventionen festlegt, jegliche semantische Information muß außerhalb des Bereichs des XML-Dokuments ausgedrückt werden.
Damit bietet XML ein großes Potential für den einheitlichen Datenaustausch zwischen Computersystemen und zwischen Anwendungen. Allerdings muß der Nutzer, um Gebrauch von der Information machen zu können, mit einem übereinstimmenden Datenmodell arbeiten. Da XML-Schemata lediglich die Struktur der Daten definieren und keine Information über den Inhalt oder den möglichen Gebrauch von Daten geben, müssen auf nächst höherer Ebene Möglichkeiten entwickelt werden, um Information auf der Meta-Ebene zu beschreiben und ihre Bedeutung zu definieren. Um diese Lücke zu füllen, wurde der RDF-Standard als Datenmodell entwickelt und vorgeschlagen (www.w3c.org) um Metadaten über Web-Sites und ihren Inhalt zu repräsentieren. [16]
2.4 Ressource Description Framework - RDF
RDF ist unabhängig von einer bestimmten Darstellungsform, am verbreitetsten ist jedoch die Repräsentation in XML. Es sind aber auch andere möglich.
Basis des RDF-Modells ist ein RDF-Tripel oder statement (Aussage), bestehend aus Subjekt (Ressource), Prädikat und Objekt. Jede Information über eine Ressource (Web-Site, XML-Element, allgemein ein Objekt, über das eine Aussage getroffen wird) wird als solches Tripel dargestellt. Jede Ressource hat einen eindeutigen Bezeichner in Form einer URI (URL). Das Prädikat ist eine spezielle Ressource, die eine Relation beschreibt, welche das Subjekt mit einem bestimmten Objekt verbindet. Es wird ebenfalls mit einer URI identifiziert. RDF läßt lediglich zweistellige Relationen zu.
Das Objekt ist wiederum eine Ressource oder ein Literal.
Die Verwendung von URI zur Identifizierung ermöglicht ein einheitliches, globales Namensschema. [Anton, S.64]
Ein statement kann auf verschiedene Weise dargestellt werden.
>Die Darstellung als RDF‑Graph dient insbesondere dem men-schlichen Verständnis. Um Maschinen den Zugang zu RDF-Repräsentationen zu ermöglichen, werden sie in XML notiert. Hierzu dient der tag rdf:RDF, welcher ein RDF-Dokument be-zeichnet. Dessen Inhalt wird mit verschiedenen description tags (rdf:description) beschrieben.
Abbildung in dieser Leseprobe nicht enthalten
RDF bietet einige für die Repräsentation von Metadaten wichtige features. Dazu gehören die sog. reiification - und aggregation -Mechanismen. Ersterer erlaubt es, Aussagen über Aussagen zu treffen, indem ein eindeutiger Bezeichner (ID) für jedes statement eingeführt wird, wodurch es seinerseits zu einer Ressource wird, also darauf Bezug genommen werden kann. RDF erlaubt außerdem, daß ein Merkmal mehrere Werte annehmen kann. Hierfür stellt RDF Datentypen für Listen und Mengen von Ressourcen (sogenannte collections) zur Verfügung,die ihrerseits wiederum Ressourcen darstellen.
[...]
- Quote paper
- Stefan Köpke (Author), 2007, Semantische Integration, Munich, GRIN Verlag, https://www.grin.com/document/90188
-
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X.