Die wahrscheinlich bedeutendste Erfindung nach dem Rad war die weltweite Vernetzung der Menschen durch das Internet. Dadurch ist unsere Welt transparent und sehr kommunikativ geworden. Allerdings ist zu Beginn des 21. Jahrhunderts diese Entwicklung soweit vorangeschritten, dass die Menschheit im Datenaufkommen und Vielfalt zu ersticken droht. Unabhängig von dieser Vielfalt, beinhaltet das aktuelle Internet eine konzeptuelle Unzulänglichkeit. Diese liegt darin begründet, dass das Web im eigentlichen Sinne nur ein Transport- und Präsentationsmedium für Dokumente ist. Inhalte sind für Computer zwar lesbar, aber nicht „versteh- oder interpretierbar“.
Suchanfragen verweisen via Volltexterkennung sehr häufig auf tausende „Treffer“, welchen aus Zeit- und Effektivitätsgründen nicht nachgegangen werden kann. Der Ruf nach einem „intelligenteren Internet“, welches Wissen, relevante Informationen und Lösungen statt tausender Dokumente liefert, wird immer lauter. Um diesen Problemen zu begegnen, sollen die Visionen des Interneterfinders Tim Berners-Lee vom Semantischen Web ausführlich vorgestellt werden. Die Idee des Semantischen Webs ist, Informationen so aufzubereiten, dass Computer darauf algorithmisch arbeiten und semantische Zusammenhänge automatisch ableiten können. Das bisherige Web soll dafür durch eine zusätzliche Schicht strukturierter Semantik erweitert werden. Hierzu ist zunächst Mehrarbeit menschlicher Autoren nötig, die ihre Informationen mit einer geeigneten Sprache um eine semantische Beschreibung erweitern muss. Ist aber diese zusätzliche Arbeit getan - und es gibt auch schon Ansätze diesen Prozess ansatzweise zu automatisieren - eröffnet sich mit der Realisierung des Semantischen Webs eine Fülle von faszinierenden, neuen Anwendungen.
Erste Prototypen und erfolgreiche Projekte sollen in diesem Rahmen vorgestellt werden. Sie sind ein Vorgeschmack auf die künftige Internetnutzung.
Diese Arbeit fokussiert insbesondere Verfahren, mit welchen den Computern die Bedeutung der im Web enthaltenen Informationen gelehrt werden können. State of the art und denkbare Entwicklungstendenzen sollen ergründet werden. Ergänzend wird eine gezielte Untersuchung der momentan sehr populären und eher benutzerbetonten Web 2.0-Technologien vorgenommen. Sie soll die Frage klären, ob diese beiden auf den ersten Blick konträren Herangehensweisen zur selbsternannten „(R)evolution des Webs“ wirklich differieren oder ausbaufähige Schnittstellen bestehen.
Inhaltsverzeichnis
Zusammenfassung
Abstract
Einführung
1.1 Zielstellung, Themenabgrenzung und Vorgehensweise
1.2 Problematik des Suchens und Findens im Internet
1.3 Motivationen und Ziele zur Entwicklung des Semantischen Webs
1 Technologien für ein Semantisches Web
1.4 Architektur des Semantischen Web nach Berners-Lee
1.5 Funktionsweise des Semantischen Web
1.5.1 Uniform Resource Identifier (URI) - Globale Namensgeber
1.5.2 RDF und RDFS – einheitliche Syntax zur Beschreibung von Daten
1.5.3 Taxonomien, Ontologien und Web Ontology Language (OWL)
1.5.4 SPARQL – RDF Abfragesprache für semantische Suchen
1.6 Auswahl semantsicher Applikationen und Prototypen
1.6.1 Piggy Bank - semantische Suche und Anreicherung von Daten
1.6.2 Semantic Media Wiki – erste freie Daten-Enzyklopädie
1.6.3 Friend of a Friend – menschliche Netzwerke beschreiben Web 2.0 / 3.0 vs. Semantisches Web
1.7 Begriff und Charakterisierung des Web 2.0 / Web 3.0
1.8 Technologien und populäre Anwendungen des Web 2.0
1.8.1 Tagging und Folksonomies – gemeinschaftliches Indexieren
1.8.2 Mash-ups – Kombination mehrerer Webseiten und -Services
1.8.3 AJAX – Internetstandard für dynamische Seiteninhalte
Zusammenfassung der Ergebnisse und Ausblick
Abkürzungsverzeichnis
Literaturverzeichnis
Internetquellenverzeichnis
Anhangsverzeichnis
Zusammenfassung
„Semantisches Web – State of the art und Entwicklungstrends“
von Manuel Kerstan
Die wahrscheinlich bedeutendste Erfindung nach dem Rad war die weltweite Vernetzung der Menschen durch das Internet. Dadurch ist unsere Welt transparent und sehr kommunikativ geworden. Allerdings ist zu Beginn des 21. Jahrhunderts diese Entwicklung soweit vorangeschritten, dass die Menschheit im Datenaufkommen und Vielfalt zu ersticken droht. Unabhängig von dieser Vielfalt, beinhaltet das aktuelle Internet eine konzeptuelle Unzulänglichkeit. Diese liegt darin begründet, dass das Web im eigentlichen Sinne nur ein Transport- und Präsentationsmedium für Dokumente ist. Inhalte sind für Computer zwar lesbar, aber nicht „versteh- oder interpretierbar“. Suchanfragen verweisen via Volltexterkennung sehr häufig auf tausende „Treffer“, welchen aus Zeit- und Effektivitätsgründen nicht nachgegangen werden kann. Der Ruf nach einem „intelligenteren Internet“, welches Wissen, relevante Informationen und Lösungen statt tausender Dokumente liefert, wird immer lauter. Um diesen Problemen zu begegnen, sollen die Visionen des Interneterfinders Tim Berners-Lee vom Semantischen Web ausführlich vorgestellt werden. Die Idee des Semantischen Webs ist, Informationen so aufzubereiten, dass Computer darauf algorithmisch arbeiten und semantische Zusammenhänge automatisch ableiten können. Das bisherige Web soll dafür durch eine zusätzliche Schicht strukturierter Semantik erweitert werden. Hierzu ist zunächst Mehrarbeit menschlicher Autoren nötig, die ihre Informationen mit einer geeigneten Sprache um eine semantische Beschreibung erweitern muss. Ist aber diese zusätzliche Arbeit getan - und es gibt auch schon Ansätze diesen Prozess ansatzweise zu automatisieren - eröffnet sich mit der Realisierung des Semantischen Webs eine Fülle von faszinierenden, neuen Anwendungen. Erste Prototypen und erfolgreiche Projekte sollen in diesem Rahmen vorgestellt werden. Sie sind ein Vorgeschmack auf die künftige Internetnutzung. Diese Arbeit fokussiert insbesondere Verfahren, mit welchen den Computern die Bedeutung der im Web enthaltenen Informationen gelehrt werden können. State of the art und denkbare Entwicklungstendenzen sollen ergründet werden. Ergänzend wird eine gezielte Untersuchung der momentan sehr populären und eher benutzerbetonten Web 2.0-Technologien vorgenommen. Sie soll die Frage klären, ob diese beiden auf den ersten Blick konträren Herangehensweisen zur selbsternannten „(R)evolution des Webs“ wirklich differieren oder ausbaufähige Schnittstellen zum Semantischen Web existieren.
Abstract
„Semantic Web – State of the art and trends of development“
by Manuel Kerstan
The most important invention of the 20th century was the World Wide Web. Though this our world became transparent and communicative. In the beginning of the 21th century the process of the development of this network produces a lot of data smog. Independently of this diversity it consist a gap of concept inside. It’s the fact that the internet itself is only a transportation and presentation medium. The contents are readable for PC´s, but not interpretable. A query refers thousands of hits, which can’t be all looked. There was a call for a more intelligent web, which provides relevant information’s instead of thousands of documents. To solve the problems the ideas of Tim Berners-Lee, the inventor of the web, should be visualised. The idea of the Semantic Web is to prepare information’s that PC´s can work in semantic contexts. The web gets an additional Layer of a semantic structure, but this need the support of the human actor, who has to add a semantic description. This process could be automated and with the realisation of the Semantic Web there are many and diverse uses. First projects and prototypes should be presented in this context. This work focuses practices which important information’s in the web could have for PC´s. State of the art and other tendencies should be fathomed. Accordingly there’s a focussed survey about actual and popular web 2.0 technologies. There should be answered if the first sight of contrary approach of the self-appointed “(r)evolution of the web” exist or if there are gateways to the semantic web.
Einführung
1.1 Zielstellung, Themenabgrenzung und Vorgehensweise
Diese Hausarbeit verfolgt den Anspruch, den aktuellen Entwicklungsstand des Internets zu Beginn des 21. Jahrhunderts aufzuzeigen. Mit Fokus auf die Visionen des Internetbegründers Tim Berners-Lee vom Semantischen Web, soll dessen mögliche zukünftige Funktionsweise, Bedeutung und Potenzial untersucht werden. Ausgehend von der Problematik des Suchens und Findens im heutigen World Wide Web, soll die Zweckmäßigkeit eines solchen semantisch angereicherten Webs aufgezeigt werden [ Kapitel 1 ]. Schlüssel zu solch einem echten Quantensprung im Internet, ist die zugrunde liegende Technologie. Aktueller Stand und erfolgreiche Anwendungen, insbesondere der Auszeichnungssprache zur Beschreibung von Wissensbeziehungen Resource Description Framework (nachfolgend RDF) und den damit erstellten komplexen Datenrepräsentationen in Form von Ontologien, sollen eingehend zum Verständnis der Funktionsweise des Semantischen Webs erläutert werden [ Kapitel 2+Anhang ]. Gegenstand der Untersuchung sind weiterhin die bewusst benutzerorientierten Technologien des so genannten "Web 2.0", die derzeit eine Wende im Netzverständnis und –Nutzung einläuten. Eine Analyse bemerkenswerter Web 2.0-Technologien und –Anwendungen soll zeigen, welche Wechselwirkungen und Schnittmengen zum Semantischen Web bestehen und welche Erkenntnisse in die weitere Entwicklung semantischer Technologien einfließen könnten. [ Kapitel 3 + Anhang ].
Abschließend sollen die Ergebnisse zusammengefasst und offene Punkte für die weitere Zukunft des Semantischen Webs abgeleitet werden [ Kapitel 4 ].
1.2 Problematik des Suchens und Findens im Internet
Fast jeder Benutzer des Internet kennt das Problem des oft zeitraubenden Suchens und tatsächlichen Findens im heutigen Internet. Man kann nie genau sagen, ob auch wirklich die beste Quelle für die Suchanfrage gefunden wurde oder nicht. Es bleibt keine andere Wahl, als sich auf die Suchalgorithmen von Suchmaschinen zu verlassen. Allerdings liefern diese für eine Suchanfrage bis zu mehrere tausend „Treffer“, welchen man theoretisch nacheinander einzeln nachgehen und nach Relevanz auswerten müsste. Ursache ist eine durch den Benutzer nicht mehr überschaubare Datenflut im Internet. Unstrukturierte Daten und isolierte Informationen erschweren massiv die Recherchen. Dieses Problem verschärft sich durch täglich neue Webseitenpublikationen und ein oftmaliges Überlappen von Informationen bei der gängigen Volltextsuche. Viele Webseiten führen die Suchwörter eher zufällig auf, ohne dass diese im Kontext zur Anfrage stehen. Andererseits liefern einige Anfragen nur unzureichende Informationsquellen, wobei der Benutzer ahnt, dass es eine relevantere Wissensquelle gibt. Es gibt dabei nur ein Problem: besonders im Geschäftsleben Entscheidungen unter hohem Zeitdruck schnell und auf sicherer Informationsbasis zu treffen. In diesen Augenblicken wünschen sich fast alle Suchenden ein „intelligenteres Internet“, eines welches sogar Fragen direkt beantworten kann oder man die Hilfe eines „virtuellen Agenten“ in Anspruch zu nehmen. Bei der Suchanfrage könnte dieser Eingrenzungen vorschlagen, womöglich aus Erfahrungen durch die Anfragen weltweiter Anwender, die bereits ein ähnliches Problem lösen mussten. Informationen haben teilweise sehr viele Bedeutungen, die aber heute aufgrund fehlender Semantik von den Maschinen nicht oder nur fehlerhaft interpretiert werden können. Das benötigte Wissen verbirgt sich verteilt auf sämtlichen Rechnern und Datenbanken dieser Welt. Es geht um die Frage: „Wie könnte man diesen Problemen begegnen?“ Dieser möchte der Erfinder des World Wide Web Tim Berners-Lee und mit ihm ein Netzwerk von Wissenschaftlern des World Wide Web Consortiums (nachfolgend W3C) entgegnen. Sie arbeiten energisch an der Realisierung des „Semantischen Webs“.
1.3 Motivationen und Ziele zur Entwicklung des Semantischen Webs
Bei der Erfindung des Internet war für Tim Berners-Lee von Anfang an die Implementierung von Links wichtig, um verschiedenste Seiten miteinander zu verknüpfen. Dies gelang mit den Hyperlinks, allerdings mit einem sehr geringen Informationsgehalt, da diese nur die Adresse der Seiten verraten, aber kaum etwas über deren Inhalt oder Bedeutung aussagen. Von Bedeutung sind dabei die Metadaten - ergänzende Daten meist im Kopf des Quellcodes, welche die Beziehung zweier verlinkter Seiten zueinander beschreiben können. Wenn zum Beispiel zwei Menschen ihre Webseiten verlinken, dann tun sie das, weil sie vielleicht als Kollegen oder Freunde zusammenarbeiten oder sie sich mit ähnlichen Themen beschäftigen. Menschen kennen die Bedeutungen der Links, Maschinen allerdings nicht. In diesen Beziehungsinformationen liegt aber ein enormes Potenzial. Das einbetten größerer Mengen an Metadaten, ließ sich mit der Hypertext Markup Language allerdings nicht realisieren.[1] Das Semantische Web versucht Daten und nicht nur Dokumente zu vernetzen, welche über das gesamte Netz und Datenbanken lose verstreut sind. Das W3C erklärte, dass das Web sein volles Potenzial nur ausschöpfen kann, wenn es ein Medium wird, in dem strukturierte und mit Bedeutung versehene Daten und Informationen durch Maschinen und automatisierte Werkzeuge verarbeitet und ausgetauscht werden können, wie es bisher nur Menschen vermögen. Dabei können diese völlig unabhängig voneinander entwickelt worden sein. Um dies zu ermöglichen, wollen Berners-Lee (als leitender Architekt, Impulsgeber und Konsensvermittler)[2], das W3C und eine Anzahl von externen Forschern und Industriepartnern das bisherige Web – was heute einem riesigen Buch mit verlinkten Dokumenten gleicht – in eine riesige verlinkte Datenbank umwandeln.[3] Bereits 1998 äußerte Berners-Lee, dass das „Konzept von maschinen-verständlichen Dokumenten keine magische künstliche Intelligenz sei, die menschliche Belange versteht, sondern vielmehr bedeutet , dass Maschinen dadurch in der Lage sind, gut definierte Probleme mit gut definierten und ausgereiften Operationen auf Basis vorhandener gut definierter Daten zu lösen “[4]. Das Wort „semantisch“ bedeutet dabei auch nicht, dass die Computer die Bedeutung von allem verstehen werden, aber dass die logischen Stücke der Bedeutung durch eine Maschine zu den nützlichen menschlichen Enden mechanisch manipuliert werden können.[5] Das Semantische Web soll also keineswegs ein eigenes Web werden, sondern eine Erweiterung des heutigen Webs.
In der Folge sollen Maschinen (Computer) und Menschen besser zusammenarbeiten können. Beispielsweise soll es möglich sein, dass Software-Agenten komplexe Aufgaben für die Benutzer ausführen. Das W3C hat dabei die Aufgaben der Definition von Standards und Technologien übernommen. Sie sollen es erlauben, Daten im Web so zu definieren und verlinken, dass sie ihren jeweiligen Wissensbereich repräsentieren. Nachfolgend sollen die wichtigsten Ziele der Entwickler zur Realisierung der Visionen und daraus ableitbare Vorteile übersichtlich dargestellt werden. Das wirklich dahinter verborgene Potenzial der resultierenden Möglichkeiten und Anwendungen lassen sich in Umfang und Tiefe derzeit noch sehr schwer erschließen. Die hier dargestellten Möglichkeiten der Anwendung sind daher nur ein Ausschnitt des Nutzenpotentials semantischer Technologien (siehe nachfolgende Übersicht).
Abbildung in dieser Leseprobe nicht enthalten
Übersicht 01: Problemfelder, Ziele und Nutzenpotenzial semantischer Webtechnologien
Quellen: Berners-Lee, Tim: Weaving a Semantic Web, MIT Technologies Conference 2001; online unter: http://www.digitaldivide.net/articles/view.php?ArticleID=20; letzter Abruf 18.01.2007;
Blumauer, Andreas / Pellegrini, Tassilo (Hrsg.): Semantic Web Fibel 06; Wien 2006, S. 15 ff.;
Fensel, Dieter (Hrsg.) / Hendler, James / Lieberman, Henry: Spinning the Semantic Web –
Bringing the World Wide Web to Its Full Potential; MIT Press, Cambridge 2005, S. 36 ff.
1 Technologien für ein Semantisches Web
Im diesem Kapitel sollen die Schlüsseltechnologien zur Realisierung des Semantischen Web vorgestellt und beispielhaft erläutert werden. Der aktuelle Entwicklungsstand der semantischen Webtechnologien (Anfang 2007) und erste nennenswerte Ergebnisse und Prototypen sollen das Nutzenpotenzial visualisieren und Verständnis für die Herangehensweise vermitteln. Es soll deutlich werden, auf welche Weise sich Semantik im Web einfach und dennoch sehr wirksam integrieren lässt.
1.4 Architektur des Semantischen Web nach Berners-Lee
Berners-Lee entwickelte zur Vision auch einen Vorschlag (keine statische Gebrauchanweisung) einer siebenstufigen Schichten-Architektur als Bauplan des Semantischen Webs. (siehe nachfolgende Abbildung)
Abbildung in dieser Leseprobe nicht enthalten
Die Schichten der Architektur sind so aufgebaut, das die jeweils obere Schicht eine Teilmenge der unteren ist. Diese Reihenfolge sollte bei der Entwicklung auch eingehalten werden, da eine stabile Ontologieumgebung aufgebaut werden soll. Die oberen Schichten machen von den jeweils unteren Gebrauch. Die Komplexität der Entwicklung steigt mit jeder Stufe.[6]
Absolut elementar ist dabei das Fundament des Semantischen Web:
Unicode[7] und Unified Resource Identifier (nachfolgend URI), sowie die Auszeichnungssprachen und Datenaustauschformate XML / XML Schema, Resource Description Framework (nachfolgend RDF) und RDF- Schema (nachfolgend RDFS).
Zunächst wird, abstrakt betrachtet, mit Unicode und URI ein Raum im Web begründet, worauf mit Auszeichnungssprachen ganze Webseiten mit spezifischen Inhalten entstehen können. Sie stellen sicher, dass internationale Zeichensätze verwendet werden und stellen ein Medium zur Verfügung, um Objekte im Semantischen Web einheitlich zu identifizieren. XML, XML-Schema und deren Namensräume, ermöglichen die Integration der semantischen Web-Definitionen mit anderen XML-basierten Standards. RDF und RDFS ermöglichen Aussagen über Objekte mit Hilfe der URIs. Außerdem kann man Vokabularien definieren, auf welche mittels URIs verwiesen werden kann. Hier erfolgt die Typisierung von Ressourcen und Beziehungen. Durch den Einsatz so genannter Ontologiesprachen wird es nun möglich, Daten nicht nur zu repräsentieren, sondern insbesondere für Maschinen verarbeitbar und interpretierbar zu gestalten. Dabei wird die Syntax der Auszeichnungssprachen XML/XML Schema für den effektiven Einsatz der RDF und RDFS verwendet. Um das zusätzliche Wissen schichtenartig in den Code zu implementieren, wird ein entsprechendes Ontologie-Vokabular (4. Stufe) benötigt. Vergleichbar mit einem Katalog oder Glossar, beinhaltet dieses eine Vielzahl an Begriffen, deren Bedeutungen und vor allem die semantischen Beziehungen zwischen den einzelnen Ressourcen. Als einheitliche Sprache, wurde die Ontologiesprache Web Ontology Language (nachfolgend OWL) vom W3C entwickelt. Dieses Vokabular kann nach definierten Deduktionsregeln (Rules) der Logik (5. Stufe) von Suchmaschinen gefunden werden. Wenn Informationen zudem nach den Regeln des Beweises (Proof, 6. Stufe) ihre Richtigkeit behalten, können auf die Vertrauen sschicht (Trust, 7. Stufe) überführt werden. Besonders die äußerst komplexen letzten drei Stufen deuten bereits heute auf ein auftretendes Problem des Semantischen Webs der Zukunft hin: die Glaubwürdigkeit der Daten. Der Endbenutzer hat dann keinen Einfluss mehr auf die Richtigkeit kombinierter Daten, da er die Quelle nicht einsehen kann. Dieses Vertrauen muss deshalb bereits vor Weiterverwendung der Daten technisch erzeugt werden.[8]
1.5 Funktionsweise des Semantischen Web
1.5.1 Uniform Resource Identifier (URI) - Globale Namensgeber
Im Zusammenhang mit der Informationsgewinnung und gemeinsamen Nutzung von Informationen entsteht der Anspruch auf Kompatibilität und Flexibilität der Daten. Die richtige Verwendung von Daten und Informationen setzt voraus, dass den Daten auch die richtige Bedeutung zugewiesen wird und in weiterer Folge nicht nur vom Menschen sondern auch von Maschinen interpretiert werden können.[9] Grundlegende Veränderung im Semantischen Web im Vergleich zum heutigen Internet ist, dass fast jedes Objekt als Ressource aufgefasst und mit Hilfe von URIs eindeutig benannt werden kann.[10] Auf diese Weise können Suchbegriffe von Maschinen nicht nur im Volltext erkannt, sondern zur weiteren Verarbeitung wieder verwendet werden – ein entscheidender Gestaltungsgrundsatz für Daten im Semantischen Web. Eine Teilmenge der URIs sind die Uniform Resource Locator (nachfolgend URL). Klassische Web-Ressourcen wie Internetseiten, werden über eine eigene URL definiert. Sie verrät neben der Namensgebung auch den Aufenthaltsort (Host) der Webseite. URIs können die gleiche Syntax haben wie Webseiten durch URLs adressiert werden. In RDF-Bibliotheken wie http://www.w3.org /1999/02/22-rdf-syntax-ns#type können Ressourcen zusammenhängend definiert werden. Die Tatsache, dass sie wie Netzadressen aussehen, ist dabei beiläufig. Die Möglichkeiten dieser Auszeichnungsform eröffnet ein nahezu unlimitiertes Spektrum und wird somit der Funktion als globaler Bezeichner absolut gerecht. Da URIs ziemlich lang sein können, werden sie in den RDF -Darstellungen normalerweise mit dem Konzept von Namensräumen von XML abgekürzt.[11] Die Suche nach bestimmten Personen, Produkten oder Orten wird dadurch eineindeutig und verhindert zahllose vermeintliche „Treffer“ aufgrund des Missverstehens der Bedeutung der Suchbegriffe. So müssen Personen auch nicht zwangsläufig in Texten auftauchen, um gefunden zu werden. Sie können ebenso gut in Beziehung zu bestimmten Seiten stehen oder über mehrere Dokumente verteilt sein. Die semantische Verschmelzung von Objekten kann erst realisiert werden, wenn Maschinen ihre Zuordnung eindeutig interpretieren können. Somit wird auch aktiv gegen das Problem der Mehrdeutigkeit von Begriffen interveniert.
1.5.2 RDF und RDFS – einheitliche Syntax zur Beschreibung von Daten
Um die Beziehungen der einzelnen Ressourcen zueinander zu beschreiben, benötigt man eine weltweit einheitliche formale Syntax, welche im Endeffekt eine automatischen Informations- und Datenverarbeitung ermöglicht.[12]
Unter der Leitung des W3C wurde dafür die Auszeichnungssprache für Metadaten RDF entwickelt und 2004 standardisiert. Sie soll es Entwicklern erleichtern, Wissen und Beziehungen zu codieren und dabei einheitlich nach einem Musterschema vorzugehen. RDF als Fundament des Semantischen Webs, muss entsprechend stabil, weitestgehend lückenlos, durchdacht und sorgfältig getestet sein. Müssen Änderungen im Fundament vorgenommen werden, kann dies schwerwiegende Änderungen in den darauf aufbauenden Standards und Applikationen nach sich ziehen.
Das RDF -Modell basiert vereinfacht auf einem gerichteten und beschrifteten Graph (siehe nachfolgende Abbildung), welcher in RDF -Browsern auch auf diese Weise Beziehungsnetze visualisieren kann.
Die Endpunkte repräsentieren dabei jeweils die in Beziehung gesetzten Ressourcen, der beschriftete und gerichtete Graph die entsprechende Beziehung oder Eigenschaft mit ihrem definierten Namen (durch URI).[13] Die Eigenschaften sind also selbst Ressourcen und müssen über eine eigene URI-Referenz verfügen. Diese URI verweist auf den so genannten RDF-Namensraum. Der Namensraum stellt ein Vokabular der Eigenschaften in Form einer Menge von RDF -Ressourcen bereit (somit verbesserte Wiederverwendbarkeit und Wartbarkeit) und beschreibt deren Bedeutungen.[14]
Zwei miteinander durch eine Eigenschaft verbundene Ressourcen werden als eine RDF-Aussage bezeichnet. Sie können als einfacher Satz mit Subjekt (Ressource A), Prädikat (Ressource B - Eigenschaft, Typ) und O bjekt (Ressource C) aufgefasst werden. So können durch das Zusammenfügen vieler kleiner Sätze auch komplizierte Sachverhalte dargestellt werden.[15]
RDF liefert somit eine flexible Methode, um jedes mögliche Wissen in kleine Stücke (so genannten Triples) zu zerlegen, mit eigenen Richtlinien über die Semantik jener Stücke.[16] Mit einem Triple kann auf semantische Art ein Objekt, Konzept oder Wert mit einem anderen in Beziehung gesetzt werden.
Mit der RDF -Standard-Familie werden zwei Namensräume vorgegeben, die ein Basisvokabular zur Erstellung und Beschreibung eigener Konstrukte bereitstellen und die für RDF notwendigen Strukturen beschreiben.[17] Zusammen bilden die das RDF-Kernvokabular (auch Core genannt). Jede Anwendung des Semantischen Webs sollte sich laut W3C an diesem Kernvokabular ausrichten und darauf operieren können.
Dieses Dataset muss für Maschinen serialisiert werden, was auf Empfehlung des W3C in XML in Form von RDF/XML[18] oder anderen Formaten wie Turtle, Notation 3, N-Triple, TriG oder Trix verlustfrei, das heißt vollständig kompatibel und standardisiert, erfolgen kann. Somit gewährleistet RDF erst die notwendige Interoperationalität zwischen den Anwendungen, die maschinen-verständliche Informationen im Web austauschen. RDF und XML sind dabei komplementär zueinander.[19] Ingesamt bestehen drei Möglichkeiten RDF -Aussagen darzusstellen: die Tripledarstellung, der gerichtete Graph oder in RDF/XML-Syntax.[20] Wenn man aus seinen Daten einen RDF-Graph abgeleitet hat, kann man nun via eindeutiger URI zusätzliche Daten, die zum Kontext gehören, in Verbindung setzen. Auf diese Weise wird nach und nach ein semantisches Netz gesponnen.[21]
Wie die meisten objektorientierten Programmiersprachen hat auch RDF ein Klassensystem. Eine Sammlung von RDF -Klassen wird als RDF-Schema bezeichnet. Diese Klassen sind in einer Hierarchie angeordnet und bieten somit Möglichkeiten der Erweiterung und Verfeinerung der Beziehungsbeschreibungen in Unterklassen an.[22] Durch RDFS ist es möglich eigene Eigenschaften, Klassen oder weitere RDF -Konstrukte zu beschreiben. Es wird dadurch jedem ermöglicht, sich ein eigenes Vokabular zu definieren, zu nutzen und zu veröffentlichen. Dabei muss nicht jedes mal ein neues Schema gefunden werden, sondern Entwickler können sich an den von W3C standardisierten Basis-Schemen orientieren und diese schrittweise an eigene Vorstellungen modifizieren. Durch die simultane Benutzbarkeit der RDF-Basis-schemen wird die Wiederverwendbarkeit von Metadaten für standardisierte Beziehungen unterstützt.[23] Die Standards sind heute soweit ausgereift, dass jeder Entwickler damit beginnen kann RDF-basierte Applikationen zu entwickeln. Die Einfachheit und die Flexibilität der Triples in Verbindung mit dem Gebrauch von URIs macht RDF sehr leistungsfähig.[24]
1.5.3 Taxonomien, Ontologien und Web Ontology Language (OWL)
RDFS ist sehr nützlich, kann aber nicht alle semantischen Anforderungen von Software erfüllen. Auf der nächsten und zugleich komplexeren Stufe des Semantischen Webs, werden Ontologien gebildet. Eine Ontologie ist definiert als ein formales, d.h. maschinenverständliches, definiertes System aus einer Vielzahl von Instanzen, Konzepten und Relationen zwischen diesen Begriffen.[25] Es ist in der Lage eine ganze Reihe von RDFS, die einen komplexen Wissens- oder Fachbereich und deren Beziehungen beschreiben und als Konzept zusammenfassen.[26] Laut der Definition des Protégé-Teams stellt eine Ontologie das Vokabular für eine Domäne zur Verfügung inklusive den Bedeutungen dieser Begriffe und beschreibt Konzepte und Beziehungen, die in dieser Domäne relevant sind.[27] Je nach Art der Repräsentation von Ontologien werden Typen unterschieden:
- Taxonomien. Systematik, die Objekte streng hierarchisch klassifiziert und bspw. durch Baumstruktur visualisiert
- Thesaurus: Objekte werden beliebig miteinander in Beziehung gesetzt
- Logisch-mathematische Repräsentationen: Objektbeziehungen werden durch formale Notationen dargestellt, z.B. Synonym (a,b) = Synonym (b,a)[28]
[...]
[1] Vgl. Berners-Lee, Tim: Weaving a Semantic Web, MIT Technologies Conference 2001; online unter: http://www.digitaldivide.net/articles/view.php?ArticleID=20; letzter Abruf 18.01.2007
[2] Vgl. Frauenfelder, Mark: Das Unvollendete (Interview mit Tim Berners-Lee), in Technology Report,
Ausgabe 11/2004, online unter: http://www.heise.de/tr/artikel/52516; letzter Abruf am 05.01.2007
[3] Vgl. W3C: Official Semantic Web Definition, online unter: http://www.w3.org/2001/sw/; letzter Abruf
02.11.2006
[4] Vgl. Berners-Lee, Tim: Semantic Web Road Map, online unter:
hppt://www.w3.org/DesignIssues/Semantic.html; letzter Abruf 25.11.2006
[5] Vgl. Tauberer, Joshua: What is RDF?, online unter: http://www.xml.com/lpt/a/1665; letzter Abruf
03.03.2007
[6] Eberhart, Andreas: Ontology-based Infrastructure of Intelligent Applications (Disseration 2004); online
unter: http://scidok.sulb.uni-saarland.de/volltexte/2004/260/pdf/EberhartProfDrWolfgangWahlster.pdf;
[7] Linkhinweis: http://www.unicode.org.
[8] Anmerkung: Um dies schon im Code zu realisieren, werden bereits ab der 3. Stufe (RDF), die
Technologie der Public Key Kryptographie angewendet. Diese elektronischen Signatur baut parallel
mit den genannten Stufen Vertrauen in das System (Trust) seitens der Anwender auf.
[9] Vgl. Tusek, Jana: Semantic Web, Saarbrücken 2006, S. 15.
[10] Siehe dazu Anhang 01 – Programmieren mit eindeutigen URI-Zuweisungen, S.28
[11] Vgl. Tauberer, Joshua: What is RDF?, online erreichbar unter: http://www.xml.com/lpt/a/1665; letzter
Abruf 03.03.2007
[12] Vgl. Fensel, Dieter (Hrsg.) / Hendler, James / Lieberman, Henry: Spinning the Semantic Web –
Bringing the World Wide Web to Its Full Potential; MIT Press, Cambridge 2005, S. 51.
[13] Herman, Ivan: Questions and answers on the Semantic Web; online unter:
http://www.w3.org/2006/Talks/0927-Berlin-IH/Slides.html, letzter Abruf 13.02.2007.
[14] Anmerkung: RDF-Namensräume haben also eine größere Bedeutung als bei XML.
[15] Tolle, Karsten: Semantisches Web und Kontext – Speicherung von und Anfragen auf RDF-Daten
unter Berücksichtigung des Kontextes (Diss.), Frankfurt am Main, 2006, S. 13.
[16] Vgl. Tauberer, Joshua: What is RDF?, online erreichbar unter: http://www.xml.com/lpt/a/1665,
letzter Abruf 03.03.2007
[17] Anmerkung: RDF-Namensraum http://www.w3.org/1999/02/22-rdf-syntax-ns# (Abkürzung rdf, enthält
Basis-RDF-Konstrukte); RDF-Schema-Namensraum http://www.w3.org/2000/01/rdf-schema# (Ab
kürzung rdfs, Namensraum zur Erstellung eigener Vokabularien).
[18] Anmerkung: Entwicklung vom W3C; festgelegt in W3C Syntax 2004; Linkhinweis: Beckett, Dave:
RDF/XML Syntax Specification (Revised). W3C Working Draft ; online unter:
www.w3.org/TR/2004/REC-rdf-syntax-grammar-20040210.
[19] Anmerkung: Die XML Syntax ist dabei allerdings nur eine mögliche Variante für RDF. Die Entwick-
lung anderer RDF-Datenmodelle ist nicht ausgeschlossen, denn Ziel ist es möglichst viele
verschiedene Datenquellen, vor allem relationale Datenbanken im Web semantisch zu integrieren.
[20] Siehe dazu Anhang 02 – RDF-Aussage in drei Darstellungsformen Graph, Triple und RDF/XML, S.29
[21] Siehe dazu Anhang 03 – Semantische Verknüpfung zweier Datasets via RDF, S. 31
[22] Anmerkung: Beispiel: rdf:Roman subclass of rdf:Literatur in einer Bibliothek
[23] Vgl. W3C Recommendation: Resource Description Framework (RDF) Model and Syntax Specificati-
ons.; online unter: http://w3.org/TR/1999/REC-rdf-syntax-19990222, letzter Abruf 27.02.2007
[24] Siehe Anhang 04 – State of the Art der RDFS-Entwicklung, S.36
[25] Vgl. Wikipedia – Semantisches Web, online unter: http://www.wikipedia.org/wiki/SemantischesWeb,
letzter Aufruf 12.03.2007
[26] Siehe Anhang 05 – Beispiel für eine Ontologie, S. 37
[27] Stanford Medical Informatics: Protégé – an open source platform; online unter:
protégé.stanford.edu/2005; letzter Abruf 12.02.2007.
[28] Vgl. Tusek, Jana: Semantic Web; Saarbrücken 2006, S.23.
-
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen.