„We are drowning in information and starved for knowledge.“ [Nais82]. John Naisbitt Das World Wide Web (WWW) hat sich in den letzten Jahren zu einem immer wichtigeren Bestandteil unserer Gesellschaft entwickelt. Die dort vorhandenen Informationen werden in vielen Einsatzgebieten verwendet, sowohl im privaten Umfeld als auch in Unternehmen. Zusätzlich zu diesem öffentlich zugänglichen Web existieren in vielen Unternehmen so genannte Intranets, die den Mitarbeitern interne Daten bzw. Informationen im Web-Format präsentieren. Die gesamte Informationsmenge, welche dem einzelnen Menschen zur Verfügung steht, steigt täglich an, und ein Ende dieser Entwicklung ist bisher nicht zu erkennen (siehe [Netc05]). Man spricht in diesem Zusammenhang oft von Informationsüberflutung (englisch „Information Overload“). Das obige Zitat des US-amerikanischen Forschers John Naisbitt charakterisiert dieses Dilemma. Obwohl oder gerade weil die Datenmenge stetig zunimmt, wird es immer schwieriger, die benötigten Informationen ausfindig zu machen und für sich zu nutzen. Deshalb gewinnt die Filterung bzw. Präsentation relevanter Informationen mehr und mehr an Bedeutung. In den meisten Anwendungen ist dies noch die Aufgabe des Benutzers, was jedoch oft mit erheblichem Zeitauf-wand oder sogar mit einem erfolglosen Suchergebnis verbunden ist. Ursache dafür ist die Tatsache, dass die meisten Benutzer mit den heute vorhandenen Datenmengen überfordert sind und nicht wissen, in welchen Quellen sie suchen sollen bzw. welche der angebotenen Informationen für sie von Relevanz sind. Mittlerweile existieren jedoch Konzepte und Technologien, mit denen diese Herausforderungen der Zukunft gemeistert werden können. Dazu zählt das Semantic Web, welches Konzepte vereint, die hauptsächlich auf dem Gebiet der Informationsfilterung und Wissensrepräsentation erhebliche Mehrwerte bringen sollen. Der Kern des Semantic Web besteht darin, im Web verfügbare Daten mit Meta-Informationen anzureichern und es dadurch Anwendungen (Agenten) möglich zu machen, die verfügbaren Daten zu verstehen bzw. Aussagen über die Bedeutung dieser Daten zu machen. „Als Wunschvorstellung verbirgt sich dahinter nichts weniger als die Weiterentwicklung des gegenwärtig präsentationsorientierten Webs zu einem universellen Kommunikationsmedium, in dem maschinelle Agenten im Auftrag von Menschen gewisse Tätigkeiten vollführen. [...]
Inhaltsverzeichnis
1 Einleitung
1.1 Zielsetzung der Arbeit
1.2 Gliederung der Arbeit
2 Grundlagen
2.1 Semantische Modelle
2.1.1 Taxonomie
2.1.2 Thesaurus
2.1.3 Topic Map
2.1.4 Ontologie
2.2 Modellierungssprachen
2.2.1 Resource Description Framework (RDF) und RDF Schema (RDFS)
2.2.2 Web Ontology Language (OWL)
3 Das Semantic Web
3.1 Motivation für die Entstehung des Semantic Web
3.2 Ziele
3.3 Aufbau
3.4 Probleme und Risiken
4 Anwendungen des Semantic Web
4.1 Produkte und Projekte der Ontoprise GmbH
4.1.1 Semantische Suche zur Vertriebsunterstützung
4.1.2 Ratgebersystem für den Kundenservice
4.2 Strategisches Personalmanagement bei der DaimlerChrysler AG
4.3 SmartWeb
4.4 Weitere Anwendungen
5 Zusammenfassende Betrachtung und Ausblick
Literaturverzeichnis
Anhang A: Ein einfaches RDF Schema
Anhang B: Beispiel eines OWL-Dokumentes
Anhang C: Bildschmirmmaske SemanticGuide
Anhang D: Ähnlichkeitsmaße zum Vergleich von Kompetenzprofilen
Anhang E: Ontologie für das strategische Personalmanagement
Abkürzungsverzeichnis
Abbildung in dieser Leseprobe nicht enthalten
Abbildungsverzeichnis
Abbildung 1: Entwicklung der semantischen Modelle (in Anlehnung an [UMA05, S. 2])
Abbildung 2: Beispiel einer Taxonomie (in Anlehnung an [UMA05, S. 3])
Abbildung 3: Beispiel eines Thesaurus (in Anlehnung an [UMA05, S. 4])
Abbildung 4: Beispiel einer Topic Map (in Anlehnung an [UMA05, S. 5])
Abbildung 5: Beispiel einer Ontologie (in Anlehnung an [UMA05, S. 9])
Abbildung 6: Beispiel eines RDF-Graphen
Abbildung 7: Schichtenarchitektur des Semantic Web (in Anlehnung an [W3WM05])
Abbildung 8: Datenintegration mit Hilfe einer Ontologie (in Anlehnung an [AMNRS05, S. 4])
Abbildung 9: Architektur des Gesamtkonzepts (in Anlehnung an [BiAb05, S. 8])
Abbildung 10: Ausschnitt aus dem Kompetenzkatalog
Abbildung 11: Bildschirmmaske SemanticGuide [Schnu05, S. 7]
Abbildung 12: Beispielhafte Kompetenzprofilvergleiche [BBA05, S. 14]
Abbildung 13: Ontologie für das strategische Personalmanagement [BBA05, S. 16]
1 Einleitung
„We are drowning in information and starved for knowledge.“ [Nais82].
John Naisbitt
Das World Wide Web (WWW) hat sich in den letzten Jahren zu einem immer wichtigeren Bestandteil unserer Gesellschaft entwickelt. Die dort vorhandenen Informationen werden in vielen Einsatzgebieten verwendet, sowohl im privaten Umfeld als auch in Unternehmen. Zusätzlich zu diesem öffentlich zugänglichen Web existieren in vielen Unternehmen so genannte Intranets, die den Mitarbeitern interne Daten bzw. Informationen im Web-Format präsentieren.
Die gesamte Informationsmenge, welche dem einzelnen Menschen zur Verfügung steht, steigt täglich an, und ein Ende dieser Entwicklung ist bisher nicht zu erkennen (siehe [Netc05]). Man spricht in diesem Zusammenhang oft von Informationsüberflutung (englisch „Information Over- load“).
Das obige Zitat des US-amerikanischen Forschers John Naisbitt charakterisiert dieses Dilemma. Obwohl oder gerade weil die Datenmenge stetig zunimmt, wird es immer schwieriger, die benö- tigten Informationen ausfindig zu machen und für sich zu nutzen. Deshalb gewinnt die Filterung bzw. Präsentation relevanter Informationen mehr und mehr an Bedeutung. In den meisten An- wendungen ist dies noch die Aufgabe des Benutzers, was jedoch oft mit erheblichem Zeitauf- wand oder sogar mit einem erfolglosen Suchergebnis verbunden ist. Ursache dafür ist die Tatsache, dass die meisten Benutzer mit den heute vorhandenen Datenmengen überfordert sind und nicht wissen, in welchen Quellen sie suchen sollen bzw. welche der angebotenen Informati- onen für sie von Relevanz sind.
Mittlerweile existieren jedoch Konzepte und Technologien, mit denen diese Herausforderungen der Zukunft gemeistert werden können. Dazu zählt das Semantic Web, welches Konzepte ver- eint, die hauptsächlich auf dem Gebiet der Informationsfilterung und Wissensrepräsentation er- hebliche Mehrwerte bringen sollen. Der Kern des Semantic Web besteht darin, im Web verfügbare Daten mit Meta-Informationen anzureichern und es dadurch Anwendungen (Agenten) möglich zu machen, die verfügbaren Daten zu verstehen bzw. Aussagen über die Bedeutung die- ser Daten zu machen. „Als Wunschvorstellung verbirgt sich dahinter nichts weniger als die Wei- terentwicklung des gegenwärtig präsentationsorientierten Webs zu einem universellen Kommunikationsmedium, in dem maschinelle Agenten im Auftrag von Menschen gewisse Tätig- keiten vollführen. Die Agenten sollen hierbei zu einem gewissen Grade regelbasiert selbstständig agieren, ohne jedoch eigenständig Entscheidungen auf intelligenter Basis treffen zu können.“ [DJMZ05, S. 1].
1.1 Zielsetzung der Arbeit
Ziel dieser Arbeit ist es, einen Überblick über verschiedene Aspekte der Vision Semantic Web zu geben und eine Einordnung dieses Begriffes in die IT-Welt zu ermöglichen. Besonders hervorgehoben werden dabei potentielle Einsatzmöglichkeiten (in Unternehmen) sowie aktuelle Anwendungen, die bereits realisiert wurden.
Es wird eine Einführung in grundlegende Begriffe wie Taxonomien und Ontologien gegeben, die im Zusammenhang mit dem Semantic Web eine Rolle spielen. Auf die einzelnen Technologien des Semantic Web wird nicht im Detail eingegangen, da dies den Rahmen der Arbeit sprengen würde. Daher erfolgt eine knappe Darstellung der wichtigsten technologischen Aspekte, um den Aufbau und die Funktionsweise des Semantic Web verstehen zu können. Das Thema Web Servi- ces bzw. Semantic Web Services wird in dieser Arbeit nicht berücksichtigt. Hier sei auf [DJK06] verwiesen. Hinsichtlich der Einsatzmöglichkeiten soll mit Hilfe ausgewählter Anwendungen ge- zeigt werden, was auf diesem Gebiet möglich ist und wo bereits durch realisierte Projekte Erfol- ge verbucht werden konnten.
1.2 Gliederung der Arbeit
Die Arbeit wird in vier Abschnitte eingeteilt, wobei die einzelnen Kapitel aufeinander aufbauen.
Zu Beginn werden in Kapitel 2 die notwendigen Grundlagen vermittelt, die für ein Gesamtver- ständnis des Konzepts Semantic Web und der beschriebenen Anwendungen erforderlich sind. Dabei werden vier semantische Modelle (Taxonomie, Thesaurus, Topic Map, Ontologie) be- schrieben und miteinander in Beziehung gesetzt. Darauf aufbauend findet eine Vorstellung der beiden Modellierungssprachen RDF und OWL statt, welche im Konzept Semantic Web eine ent- scheidende Rolle spielen.
Kapitel 3 ist dem eigentlichen Konzept Semantic Web gewidmet. Ausgehend von der Motivation für die Entstehung dieses Konzepts werden Ziele und Aufbau des Semantic Web beschrieben. Danach folgt eine Darstellung von Problemen und Risiken, die es in Zusammenhang mit dem Semantic Web zu berücksichtigen gilt.
In Kapitel 4 werden ausgewählte Anwendungen vorgestellt, die semantische Technologien einsetzen und die Nutzwerte des Semantic Web dadurch praktisch aufzeigen.
Zum Abschluss werden in Kapitel 5 eine zusammenfassende Betrachtung zu den dargestellten Themen sowie ein Ausblick in die Zukunft des Semantic Web bzw. seiner Anwendungen gege- ben.
2 Grundlagen
Dieses Kapitel vermittelt die wichtigsten Grundbegriffe, die im Semantic Web eine Rolle spielen. Zu Beginn werden die vier semantischen Modelle Taxonomie, Thesaurus, Topic Map und On- tologie erläutert. Mit ihnen ist es möglich, Daten in unterschiedlich starken Ausprägungen eine Bedeutung zu verleihen. Von diesen vier Ansätzen ist die Ontologie hinsichtlich der semanti- schen Ausdrucksmöglichkeiten am mächtigsten und wird daher am ausführlichsten beschrieben. Die folgende Abbildung zeigt, wie die Stärke der Semantik von Modell zu Modell zunimmt.
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 1: Entwicklung der semantischen Modelle (in Anlehnung an [UMA05, S. 2])
Um diese Ansätze auch tatsächlich umzusetzen, sind entsprechende Modellierungssprachen notwendig. Das Resource Description Framework (RDF) und die Web Ontology Language (OWL) sind im Zusammenhang mit dem Semantic Web wichtige Vertreter dieser Art und wurden vom World Wide Web Consortium (W3C) empfohlen (siehe [W3SW05]). Daher werden diese beiden Sprachen im Anschluss an die semantischen Modelle dargestellt.
2.1 Semantische Modelle
2.1.1 Taxonomie
In der Informationstechnologie kann eine Taxonomie wie folgt definiert werden: „The classification of information entities in the form of a hierarchy, according to the presumed relationships of the real-world entities that they represent“ [DOS03, S. 146].
Taxonomien ermöglichen es, Dinge hierarchisch zu kategorisieren und besitzen eine einfache baumartige Struktur. Vom obersten Element - der Wurzel - gehen eine oder mehrere Ableitun- gen aus, die Zweige genannt werden und zu Unterkategorien des Wurzelementes führen. Diese Unterkategorien - Knoten genannt - können ebenfalls beliebig viele Zweige besitzen, die zu wei- teren Unterkategorien führen. Geht von einer Kategorie keine Ableitung aus, wird sie als Blatt bezeichnet. Für die Interpretation der Taxonomie ist die Art der Ableitung ein wichtiger Faktor, „ist-Unterklasse-von“ und „ist-Teil-von“ sind hier die beiden wichtigsten Beispiele. Es kann aller- dings auch sein, dass die Art der Ableitung nicht genau definiert ist (siehe Beispiel in Abbildung 2).
In unserer realen Welt spielen Taxonomien eine bedeutende Rolle, denn es liegt in der Natur des Menschen, Dinge zu klassifizieren. Beispielsweise kann man ein Auto in verschiedene Unterkategorien wie Limousine, Kombi und Sportwagen einteilen. Diese drei Unterkategorien stehen mit der übergeordneten Kategorie (Elternknoten) in der Beziehung „ist-Unterklasse-von“.
Das folgende Beispiel ist [UMA05, S. 3 ff.] entnommen und wird durchgängig bei der Erläuterung aller vier semantischen Modelle verwendet, damit die Unterschiede der vier Ansätze deutlich werden.
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 2: Beispiel einer Taxonomie (in Anlehnung an [UMA05, S. 3])
Dieses Beispiel zeigt eine Taxonomie, bei welcher den Ableitungen keine besondere Bedeutung zukommt. „Semantik“ ist ein „Thema“, wobei „F-Logic“ wiederum ein Unterthema von „Seman- tik“ ist. Es lässt sich hier nicht ausdrücken, dass ein „Doktorand“ das deutsche Äquivalent zum „PhD Student“ ist, da keine Beziehungen zwischen Knoten gleicher Ebene definiert werden kön- nen. Ein weiterer Nachteil besteht darin, dass ein Knoten mehreren Elternknoten nur dann zuge- ordnet werden kann, wenn er mehrfach angelegt wird. Dies führt allerdings zu Redundanz, welche es u.a. aus Gründen der einfacheren Wartbarkeit grundsätzlich zu vermeiden gilt.
Besteht also lediglich die Anforderung, einfache Baumstrukturen mit Beziehungen des Typs „istUnterklasse-von“ oder „ist-Teil-von“ abzubilden, so genügt üblicherweise eine Taxonomie. Geht es allerdings um komplexere Sachverhalte, reichen die Möglichkeiten von Taxonomien nicht aus, und es muss einer der folgenden Ansätze gewählt werden.
2.1.2 Thesaurus
„Als Thesaurus bezeichnet man ein Modell, das versucht, ein Themengebiet genau zu beschrei- ben und zu repräsentieren. Es besteht aus einer systematisch geordneten Sammlung von Begrif- fen, die in Beziehung zueinander stehen.“ [WiTh05]. Hinsichtlich der Möglichkeit, Relationen zwischen den einzelnen Begriffen zu definieren, ist ein Thesaurus mächtiger als eine Taxonomie. Zusätzlich zu den aus Taxonomien bekannten hierarchischen (oder auch undefinierten) Bezie- hungen kann bei der Erstellung eines Thesaurus auf folgende fest definierte Relationen zurück- gegriffen werden:
- Ähnlichkeitsrelation
Knoten A „ist ähnlich zu“ Knoten B.
- Synonymrelation
Knoten A „ist Synonym zu“ Knoten B (eine Definition des Begriffes Synonym ist in Kapitel 3.1 zu finden).
Die Erstellung selbstdefinierter Relationen ist bei einem Thesaurus nicht möglich. Dies ist ein Nachteil, der dazu führen kann, dass bestimmte Sachverhalte nicht abgebildet werden können. In einem solchen Falle ist eine Topic Map (siehe Kapitel 2.1.3) oder eine Ontologie (siehe Kapitel 2.1.4) die bessere Wahl.
Das aus Kapitel 2.1.1 bekannte Beispiel wird nun wieder aufgegriffen und um die Möglichkeiten, die ein Thesaurus bietet, erweitert (siehe Abbildung 3). Die Information, dass „Doktorand“ ein Synonym zu „PhD Student“ ist, kann nun abgebildet werden. Außerdem ist es möglich, die Ähnlichkeitsbeziehung zwischen „F-Logic“ und „Ontologie“ im Modell zu definieren.
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 3: Beispiel eines Thesaurus (in Anlehnung an [UMA05, S. 4])
2.1.3 Topic Map
Die Topic Map ist ein Ansatz, der dem Gedanken von Ontologien recht nahe kommt. Topic Maps besitzen gegenüber den anderen vorgestellten Modellen die eindeutigste Definition, da es sich hierbei um einen ISO-Standard (siehe [ISOTM05]) handelt (vgl. [UMA05, S. 4]).
Im Wesentlichen besteht eine Topic Map aus
- Topics (Gegenstände),
- Scopes (Gültigkeitsbereiche der Topics),
- Assoziationen (Verbindungen zwischen Topics) und
- Occurences (zugeordnete Dokumente außerhalb der Topic Map).
Ein Topic kann ein beliebiger Gegenstand aus der realen Welt sein, der mit Hilfe einer Topic Map beschrieben werden soll.
Da ein Topic mehrere Namen enthalten kann, wird über Scopes festgelegt, wann welcher Name gültig ist. So ist es möglich, ein Topic mehrsprachig anzulegen, z.B. kann das Topic „Auto“ zwei Namen haben („Auto“ und „car“). Wird in diesem Fall der Scope „Englisch“ ausgewählt, so gilt nur der Name „car“.
Mit Hilfe von Assoziationen können Querbeziehungen zwischen Topics hergestellt werden. Der wesentliche Vorteil gegenüber einem Thesaurus ist, dass diese Beziehungen frei definiert werden können und nicht auf bestimmte Arten (Ähnlichkeits- und Synonymrelation) beschränkt sind.
Occurences bieten die Möglichkeit, ein Topic einem oder mehreren externen Dokumenten (z.B. Webseiten) zuzuordnen. Durch dieses Prinzip trennt man die Informationen der Topic Map von den eigentlichen Informationsbasen, was den Vorteil hat, dass keine Rücksicht darauf genom- men werden muss, wie die tatsächlichen Daten (externe Dokumente) gespeichert sind. So kön- nen externe Dokumente, die mit verschiedenen Topics verknüpft sind, miteinander in Beziehung gesetzt werden, indem die Relationen innerhalb der Topic Map nachvollzogen werden.
Topic Maps finden meist in den Bereichen „Suchunterstützung, Visualisierung und Navigation durch Themengebiete“ [UMA05, S. 5] Anwendung.
Am Beispiel werden nun die zusätzlichen Möglichkeiten durch eine Topic Map angewendet (siehe Abbildung 4). Jetzt ist es möglich, zwischen den einzelnen Knoten Beziehungen zu definieren, z.B. die Relation „schreibt“ zwischen „Person“ und „Dokument“ oder die Relation „behandelt_in“ zwischen „Thema“ und „Dokument“. Durch solche Querbeziehungen können im Vergleich zum Thesaurus komplexere Sachverhalte abgebildet werden. Der „Doktorand“ ist in der Topic Map mit verschiedenen Attributen ausgestattet, z.B. „Alter“ und „Name“. Außerdem kann er auf externe Dokumente (z.B. Webseiten) verweisen.
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 4: Beispiel einer Topic Map (in Anlehnung an [UMA05, S. 5])
2.1.4 Ontologie
„An ontology is an explicit, formal specification of a shared conceptualization of a domain of interest.“ [Grub95].
Thomas R. Gruber
Der Begriff Ontologie ist zurückzuführen auf den griechischen Philosophen Aristoteles, der sich in seinen Schriften zur Metaphysik als erster mit diesem Thema beschäftigte. In der Philosophie versteht man darunter die Lehre vom Sein oder die Lehre vom Seienden (vgl. [UMA05, S. 6]).
Im 20. Jahrhundert wurde der Begriff Ontologie von der Informatik aufgegriffen und seitdem v.a. in den Bereichen der Künstlichen Intelligenz und des Wissensmanagements verwendet.
Das obige Zitat von Thomas R. Gruber ist in diesem Zusammenhang die bedeutendste Definition und wird daher im Folgenden näher erläutert. Mit „conceptualization“ ist ein abstraktes Modell gemeint, das sich auf einen Realweltausschnitt bezieht und dessen relevante Konzepte abdeckt. „Explicit“ bedeutet, dass die in der Ontologie verwendeten Konzepte eindeutig definiert sein müssen. Die Spezifikation soll ebenfalls „formal“ sein, um Maschinenlesbarkeit zu gewährleisten. Die Anforderung, dass das in der Ontologie reflektierte Wissen nicht nur von einer Einzelperson, sondern von einer größeren Personengruppe gemeinsam akzeptiert werden muss, wird durch „shared“ ausgedrückt. Mit „domain of interest“ wird ausgedrückt, dass man sich bei der Model- lierung auf die Bereiche der Realwelt beschränken soll, die für die durchzuführenden Aufgaben relevant sind. Der abgebildete Bereich wird auch als Domäne bezeichnet.
Eine Ontologie besteht aus vier grundlegenden Komponenten:
- Konzepte
Konzepte können als Oberbegriffe angesehen werden und definieren die Struktur der Ontolo- gie. Hierarchische Beziehungen können in Ontologien ausgedrückt werden, indem Konzepten (Oberkonzepte) andere Konzepte untergeordnet werden. So kann mit Hilfe einer Ontologie ei- ne Taxonomie (siehe Kapitel 2.1.1) realisiert werden. Ein Konzept besitzt i.d.R. eine oder meh- rere Ausprägungen (Instanzen), welche die Objekte aus der Realwelt darstellen. „Person“ kann beispielsweise ein Oberkonzept sein, dem die Konzepte „Student“ und „Akademiker“ untergeordnet sind (siehe Abbildung 5).
- Relationen
Relationen ermöglichen es, verschiedene Konzepte miteinander in Beziehungen zu setzen. Die meisten Ontologierepräsentationssprachen (z.B. OWL) erlauben es, die Relationen mit zusätzlichen Eigenschaften zu versehen. So kann eine Relation z.B. als transitiv oder symmetrisch definiert werden. Zwischen den Konzepten „Thema“ und „Dokument“ besteht z.B. die Relation „behandelt_in“ (siehe Abbildung 5).
- Instanzen
Instanzen sind Ausprägungen von Konzepten und vertreten somit „Dinge aus der realen Welt, über die Wissen in der Ontologie abgelegt ist. Ihre Ausprägung richtet sich nach den Regeln der Konzeptebene.“ [Haus05, S. 26]. Bestehen also Relationen zwischen den Konzepten von Instanzen, so werden diese Relationen auch auf die entsprechenden Instanzen übertragen. Ein Beispiel für eine Instanz ist „Max Müller“, der eine Ausprägung des Konzeptes „Doktorand“ darstellt (siehe Abbildung 5).
- Attribute
Attribute stellen Eigenschaften von Konzepten dar und werden in den entsprechenden Instanzen verwendet. „Alter“ oder „Name“ sind beispielsweise Attribute zum Konzept „Doktorand“ (siehe Abbildung 5).
Oft werden Ontologien zusätzlich mit einem Regelwerk angereichert, das eine noch detailliertere Definition von Konzepten und Relationen erlaubt. „Durch die Verwendung von Regeln lassen sich logische Schlussfolgerungsketten aufbauen und somit implizite Verknüpfungen erkennen. Da- durch wird neues Wissen abgeleitet, also die Möglichkeit zu einer Inferenz gebildet.“ [Jann05, S. 4]. Ein Beispiel (entnommen aus [UMA05, S. 8]) für eine Regel ist: „Schreibt“ eine „Person“ zu einem bestimmten „Thema“ ein „Dokument“, dann „kennt“ diese „Person“ auch implizit das „Thema“. Man kann also automatisch die Schlussfolgerung ziehen, dass diese „Person“ das „Thema“ „kennt“, obwohl dies nicht explizit angegeben ist (siehe Abbildung 5).
Das Beispiel aus den vorherigen Kapiteln wird nun um die Möglichkeiten von Ontologien erweitert. Es ist zu erkennen, dass v.a. gegenüber Taxonomien und Thesauri - welche prinzipiell einfache Ontologien sind - große Vorteile hinsichtlich der semantischen Ausdrucksmöglichkeiten bestehen. Auch Topic Maps können unter Berücksichtigung gewisser Bedingungen komplett in Ontologien überführt werden.
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 5: Beispiel einer Ontologie (in Anlehnung an [UMA05, S. 9])
Die Hierarchie wurde hier neu geordnet. Die Begriffe „Ontologie“ und „F-Logic“ befinden sich nun auf derselben Ebene wie „Semantik“ und stehen mit „Semantik“ durch die Relation „Unter- thema“ in Verbindung. Alle drei Konzepte haben „Thema“ als Oberkonzept. „Doktorand“ und „PhD Student“ stellen eigentlich identische Konzepte dar. Deshalb wurden sie zusammengefasst und mit mehrsprachigen Begriffen in Deutsch und Englisch versehen. Da ein „Doktorand“ gleich- zeitig „Student“ und „Akademiker“ ist, verweist er auf diese beiden Oberkonzepte. Eine tatsäch- liche Ausprägung des Konzeptes „Doktorand“ stellt die Instanz „Max Müller“ dar.
Neben den beschriebenen Möglichkeiten können Ontologien außerdem dazu dienen, Daten aus verschiedenen heterogenen Quellen (z.B. Datenbanken, andere Ontologien) zu integrieren. Hier- bei werden Konzepte aus der Ontologie mit Teilen externer Datenquellen (z.B. ein Datenbankfeld oder ein Konzept in einer anderen Ontologie) verknüpft. Dies wird als Mapping bezeichnet.
Abschließend kann gesagt werden, dass Ontologien sämtliche Eigenschaften von Taxonomien, Thesauri und Topic Maps abdecken sowie zusätzliche semantische Fähigkeiten wie z.B. die Möglichkeit der Regeldefinition bieten. Die Integrationsmöglichkeit externer Datenquellen ist ein weiterer Aspekt, der für einen Einsatz von Ontologien spricht.
2.2 Modellierungssprachen
2.2.1 Resource Description Framework (RDF) und RDF Schema (RDFS)
„The Resource Description Framework (...) is a W3C recommendation that defines a language for describing resources.“ [McBr04, S. 51].
Brian McBride
RDF ermöglicht es, Ressourcen im Web zu beschreiben, und stellt das grundlegende Datenmodell für das Semantic Web dar (siehe Kapitel 3.3).
Sämtliche Ressourcen werden über einen Uniform Resource Identifier (URI) eindeutig bezeich- net. URI sind v.a. aus dem WWW bekannt, wo sie dazu eingesetzt werden, um Webseiten eindeu- tig zu adressieren (z.B. http://www.google.com). Diese spezielle Ausprägung eines URI heißt Uniform Resource Locator (URL) und besitzt im Gegensatz zum allgemeinen URI die Besonder- heit, dass sie im WWW auflösbar ist (siehe [WiDNS06]). Dies ist bei den im Semantic Web einge- setzten URI nicht zwingend erforderlich, da sie Konzepte und keine physischen Ressourcen bezeichnen.
Ressourcen werden mittels RDF beschrieben, indem man Aussagen über sie aufstellt. Eine Aussage ist dabei ein Tripel, das sich - in Anlehnung an die Grammatik der natürlichen Sprache - aus den folgenden drei Bestandteilen zusammensetzt:
- Subjekt
Das Subjekt ist die zu beschreibende Ressource (resource).
- Prädikat
Das Prädikat stellt eine Eigenschaft einer Ressource dar (property).
- Objekt
Das Objekt ist der Wert einer Eigenschaft (property value).
An einem einfachen Beispiel wird dieses Prinzip nun erläutert. Es soll mittels RDF ausgedrückt werden, dass Max Müller der Autor der Ressource http://www.maxmaier.de ist. Hier ist „http://www.maxmaier.de“ das Subjekt, „Autor“ das Prädikat und „Max Maier“ der Wert des Prädikats, also das Objekt. Eine RDF-Aussage kann u.a. als Graph, in der Notation 3 (N3) und in der so genannten RDF/XML-Syntax dargestellt werden. Die verschiedenen Möglichkeiten werden nun anhand des Beispiels präsentiert.
Die folgende Abbildung zeigt die Darstellung der Aussage als Graph.
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 6: Beispiel eines RDF-Graphen
Die Notation 3 ist neben der Darstellung als Graph eine weitere Art, um RDF-Aussagen für Men- schen gut lesbar zu präsentieren. Der folgende Code-Ausschnitt zeigt, wie das Beispiel in Notati- on 3 aussieht.
Abbildung in dieser Leseprobe nicht enthalten
Die RDF/XML-Syntax ist die am weitesten verbreitete Darstellungsform und eignet sich am bes- ten für die Maschinenverarbeitung. Diese Syntax basiert auf XML, der Extensible Markup Langu- age (siehe [W3XML05]). Im folgenden Code-Ausschnitt wird das Beispiel in RDF/XML-Syntax dargestellt.
Abbildung in dieser Leseprobe nicht enthalten
Die Möglichkeiten, Ressourcen zu beschreiben, sind bei RDF allerdings beschränkt. Es ist nicht möglich, die Beziehungen zwischen Ressourcen in einer standardisierten Weise zu beschreiben. Die Klassifizierung von Gegenständen ist ein wichtiges Merkmal von semantischen Modellen und sollte daher von einer Modellierungssprache unterstützt werden. Ein weiteres Problem besteht
[...]
- Quote paper
- Thomas Hafner (Author), 2005, Das Semantic Web und seine Anwendungen, Munich, GRIN Verlag, https://www.grin.com/document/60997
-
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X.