Inhaltsverzeichnis
1 Einleitung
2 Entwicklung des Semantic Web
3 Einführung in das Semantic Web
4 Technik des Semantic Web
5 Anwendungsmöglichkeiten
6 Kontrollfragen
Abkürzungsverzeichnis
Literatur
Quellen aus dem Internet
1 Einleitung
Max Semantitsch kommt heute früher von der Arbeit nach Hause. Heute Abend hat er eine Dame, die er bei einem Geburtstag eines Freundes kennen gelernt hat und sehr nett fand, zu einen Abendessen zu zweit bei sich zuhause eingeladen. Da alle Geräte in seinem Haus vernetzt sind und daher smarte Objekte darstellen, wissen diese durch den automatischem Abgleich mit dem elektronischen Organizer von Max Semantitsch, dass dieser heute Abend ein romantisches Abendessen geplant hat. Bereits auf der Heimfahrt kommuniziert der Bordrechner von Semantitschs Auto mit den intelligenten Systemen in dessen Haus und avisiert die Ankunft. Dadurch wird im Haus bereits die von Max Semantitsch gewünschte Konfiguration der Beleuchtung, der Unterhaltungselektronik, des Heizungs- und Klimasystems, der Küchengeräte sowie sämtlicher Rollläden und Jalousien hergestellt. Nach Betreten seines Hauses geht Max Semantitsch in die Küche. Dort liegen bereits alle Zutaten für das von ihm gewünschte Gericht bereit. Sein Küchenrechner hat diese bereits automatisch im Auftragsverwaltungssystem des Lebensmittelhändlers bestellt.
Zum jetzigen Zeitpunkt ist das Zukunftsmusik. Allerdings bietet das Semantic Web die Basistechnologien, um eine automatische Kommunikation zwischen verschiedenen Maschinen bzw. smarten Objekten zu ermöglichen. In den folgenden Kapiteln werden sowohl die historischen Entwicklungen in Richtung des Semantic Web wie auch die technologischen Anforderungen, die hinter dem Semantic Web stehen, aufgezeigt. Am Ende werden zwei Anwendungen aus der Praxis dargestellt, wobei die sich eine davon noch im Entwicklungsstadium befindet.
2 Entwicklung des Semantic Web
Zur Erläuterung der Techniken des Semantic Web erfolgt im folgenden Kapitel zuerst ein kurzer Abriss über die Evolution der Internettechnologien im World Wide Web (WWW), welches wie auch z. B. das File Transfer Protokoll (FTP) in die oberste Schicht der Protokollebenen des Internetprotokolls (TCP/IP) eingeordnet wird.
Die Evolution der Internettechnologien für die Allgemeinheit begann mit der Erweiterung des bestehenden Internets durch bessere Darstellungsmöglichkeiten . Daraus entwickelte sich die Hypertext Markup Language (HTML), eine einfach zu erlernende Sprache zur Visualisierung von Inhalten, die eine große Bandbreite von Formatierungen und Gestaltungselementen enthält sowie auch das Einfügen von Bildern ermöglicht. Die Grundlagen für die Entwicklung von HTML liegen in der Metasprache Standard Generalized Markup Language (SGML), einer Seitenbeschreibungssprache, die 1986 durch das Conseil Européen de Recherches Nucleaires (CERN) (vgl. /CER-03/) in Genf entwickelt wurde. Der nächste große Schritt in der Evolution des WWW wurde 1998 parallel mit der Definition der Version 4 des HTML-Standards eingeleitet. Die eXtensible Markup Language (XML) war geboren. Die Eliminierung unnötiger Befehle aus SGML und die Unterstützung für Auszeichnungsbefehle machte XML zum neuen Quasi-Standard für die Erstellung strukturierter Dokumente im WWW. Als Fortführung des XML-Standards wurde XHTML als Ableger von HTML und XML erstellt. Mit XHTML wird die Darstellung von Webseiten als strukturierte Daten im WWW erleichtert. Dadurch wird XHTML HTML zukünftig ersetzen. Dabei sind HTML und XHTML keine eigenständigen Metasprachen, sondern nur als Erweiterungssprachen von SGML und XML zu verstehen, die hierarchisch eine Ebene über HTML und XHTML angeordnet sind (vgl. /Ger-02, S. 3-5/ i. V. m. /Net-03/).
Die Weiterentwicklung der Technologien in Richtung des Semantic Web im Jahr 1999 wurde hauptsächlich von Tim Berners-Lee, dem Mitbegründer des World Wide Web (WWW) inspiriert (vgl. /c´t-02/). Hierzu teilen Geromenko und Chen das Web in zwei Generationen ein.
Die erste Generation besteht aus dem WWW der statischen Inhalte, in dem Seiten statisch, also ohne Interaktionen auf einem Internetserver, vorhanden waren, und dem WWW der dynamischen Inhalte. Bei statischen Seiten beschränkten sich die Interaktionen auf Verweise in Form von Hyperlinks und animierte Grafiken in CompuServes Graphics Interlaced Format (GIF). Datensätze aus Datenbanken konnten dabei unter Verwendung der Structured Query Language (SQL) abgefragt werden. Das WWW der dynamischen Inhalte besteht hingegen aus dynamischen Ergänzungen wie Active Server Pages (ASP), JavaScript, Macromedia Flash, dynamischem HTML (DHTML) usw. Datenbankanbindungen zur Ausgabe von dynamisch erstellten Webseiten werden durch ASP und andere serverseitige Technologien zur Erstellung von Internetseiten während der Übertragung bereitgestellt.
In der Weiterentwicklung des WWW wird die zweite Generation des WWW von Technologien wie XML, dem Resource Description Framework (RDF) und anderen maschinenlesbaren Formaten von Daten geprägt. Dabei fungiert das WWW als eine einheitliche XML – basierte, selbsterklärende Datenbank mit Softwareagenten, die aus diesen Daten Schlussfolgerungen ziehen können (vgl. /Ger-03/ S. 10).
3 Einführung in das Semantic Web
Die Idee des Semantic Web entstand vor dem Hintergrund einer unüberschaubaren Anzahl von Dokumenten im WWW, hoher Redundanz von Informationen, aber auch aufgrund wirtschaftlich getriebener Überlegungen nach Steigerung der Effizienz, welche häufig durch Prozessintegration und damit verbundene Integration verschiedener Datenbanken erreicht wird (vgl. /Guh-01/). Alle diese Dokumente sind hinsichtlich der Darstellung und Programmierung auf die Nutzung durch Menschen optimiert. Maschinen können Informationen aus diesen Seiten nur bedingt, z. B. über mächtige Suchalgorithmen großer Suchmaschinen, auswerten. Zum leichteren Auffinden und Erhöhung der Relevanz der gefundenen Seiten muss eine Maschine in der Lage sein, Gliederungen und Klassifizierungen diverser Informationen aus einer einzelnen Seite bzw. aus mehreren Seiten vornehmen zu können. Dazu müssen die Informationen zusätzlich zur visuellen Darstellungsform auch in maschinenlesbarer Form dargestellt sein. Hier setzt das Semantic Web an.
Das Semantic Web verfolgt den Ansatz, alle Seiten im WWW um einen semantischen Inhalt zu erweitern. Anhand dieser Zusatzinformationen wird der Inhalt der Seite für andere Maschinen oder genauer Programme lesbar. Man spricht in diesem Zusammenhang auch oft von einem Web für Maschinen (vgl. /Euz-02/). Dabei ist der zugrundeliegende Begriff Semantik als die Lehre von der Bedeutung sprachlicher Zeichen (Wörter, Vor- und Nachsilben o. ä.) sowie der Benennung von Begriffen definiert (vgl. /WAH-00/).
Die Kommunikation im Semantic Web erfolgt in Form von elektronischen Agenten, die im Auftrag von Menschen autonom handelt. Dies verdeutlicht auch den Unterschied zur künstlichen Intelligenz, d. h. der Artificial Intelligence (AI), bei der Maschinen selbstlernend autonom ohne den Eingriff von Menschen handeln. Neues Wissen und Schlussfolgerungen sind nur bedingt im Rahmen sogenannter Inferenzen möglich, die im weiteren Verlauf noch näher erklärt werden (vgl. /c´t-02/).
4 Technik des Semantic Web
Das Semantic Web baut hauptsächlich auf drei Technologien auf (vgl. /c´t-02/):
1. eXtensible Markup Language (XML)
2. Resource Description Framework (RDF)
3. Ontologien
Weitere Technologien, die bereits im historischen Abriss erwähnt wurden, sind ebenfalls Bestandteil des Semantic Web. Sie werden hier aufgrund der Übersichtlichkeit nicht nochmals erwähnt.
XML dient als genereller Standard für die Syntax für alle Technologien im Rahmen des Semantic Web.
Das Resource Description Framework (RDF) dient zur Formulierung von Sachverhalten auf maschinenlesbaren Internetseiten,. Hierzu bedient RDF sog. Tripels. Diese bestehen immer aus Subjekt, Prädikat und Objekt, wobei das Prädikat die Eigenschaft (vgl. auch Prädikat als Satzaussage in der Grammatik) also die Beziehung zwischen Subjekt und Objekt darstellt. Die verschiedenen Knoten des Systems sind entweder Subjekt oder Objekt, je nachdem wie die Eigenschaft vergeben wird. Die Eigenschaft eines Elements im System wird durch einen Uniform Resource Identifiers (URI) vergeben. Ein URI kann sowohl ein Verweis auf eine Internetseite in Form eines Uniform Resource Locators (URL) z. B. http://www.beispielweb.de/beispiel sein als auch einer beliebige alphanumerische Zeichenfolge. Ein Beispiel für ein Tripel wäre Max Semantisch ist Professor an der Fachhochschule Pforzheim. Hierbei wäre Max Semantisch das Subjekt und die Fachhochschule Pforzheim das Objekt. Die Beziehung bzw. Aussagekraft des Satzes kommt durch das Prädikat „ist die Professur“ zustande (vgl. Kyl-03).
Zur Vermeidung von Inkonsistenzen durch verschiedene URI´s, welche die gleiche Bedeutung haben aber auf unterschiedliche Ressourcen verweisen, benötigt das Semantic Web Ontologien. Diese sind wissenschaftlich als die Lehre vom Sein und seinen Prinzipien definiert (vgl. /WAH-00). Unterschiedliche Ressourcen können anhand von Prinzipien z. B. mit der gleichen Bedeutung können dadurch zusammengeführt. Die Effektivität der Suche wird erhöht. Aufgrund der Komplexität der Sprachen und der Bedeutung der Wörter sind Ontologien immer nur auf ein spezifisches Gebiet beschränkt. Ontologien sind vergleichbar mit intelligenten Datenbanken, in denen maschinenlesbare Definitionen eines spezifischen Gebiets und die entsprechenden Beziehungen unter diesen Definitionen enthalten sind (vgl. /Hef-03/). Grundsätzlich können folgende Beziehungen dargestellt werden:
1. Äquivalenzbeziehungen
Hierunter wird die Erkennung von gleichbedeutenden Begriffen verstanden.
2. Taxonomien Die Gliederung und Klassifizierung von Elementen des Systems kann ebenfalls erfolgen. Objekte und Eigenschaften werden in Klassen eingeteilt. Die Oberklasse über allen Klassen der Objekte heißt „thing“ (zu deutsch Ding, oder besser Sache). Eine Klasse wäre z. B. die Klasse Person. Sie umfasst die Subjekte Mann, Frau und Kind. Die drei Subjekte könnten aber jeweils wieder eine Unterklasse der Klasse Person sein. Gleiche Hierarchien sind auch auf die Beziehungen zwischen den Klassen bzw. Eigenschaften anwendbar. Z. B. kann die Beziehung „hat Geschwister“ als Untereigenschaft der Beziehung „hat Verwandte“ angesehen werden. Der Vorteil zeigt sich z. B. bei der Suche nach einem Prozessor. Ein passender Fund wie Athlon würde aber nur durch Taxonomien als Prozessor erkannt (Hierarchie Prozessor – AMD – Athlon).
3. Inferenzregeln Inferenzen bauen auf Taxonomien auf und könne aufgrund der hierarchischen Einordnung von Taxonomien Folgerungen ziehen. Dies sei an einem Beispiel aus den Verwandtschaftsverhältnissen verdeutlicht. Eine Taxonomie besagt, dass ein Kind eine Tochter oder / und Sohn sein kann. Die zweite Taxonomie besagt, dass eine Frau, die Kinder hat, eine Mutter ist. Sucht der Agent nach Müttern und findet eine Frau mit einem Sohn, kann eraus den Taxonomien zuordnen, dass ein Sohn ein Kind ist. Im zweiten Schritt sieht er, dass eine Frau mit einem Kind eine Mutter ist und zieht den entsprechenden Schluss (vgl. /McG-03/).
Die zwei führenden Sprachen für Ontologien sind Ontology Inference Layer (OIL) und DARPA Agent Markup Language (DAML). Dabei ist OIL eine europäische Entwicklung unter Federführung der Universität Karlsruhe und DAML die amerikanische Entwicklung unter der Leitung der Universität von Maryland. Inzwischen haben die Standardisierungsbestrebungen des W3C Konsortiums einen Konsens zugunsten einer einheitlichen Sprache unter dem Namen DAML + OIL erreicht (vgl. /Euz-02/).
Unter den gegebenen Umständen würde das Semantic Web große datenschutzrechtliche Probleme mit sich bringen. Ein Problem ist die Glaubwürdigkeit des Urhebers der Informationen. Nicht jede Resource ist vertrauenswürdig. Allerdings können durch den Nutzer sowie den Autor der Information bestimmte Vertrauensstellungen definiert werden. Dabei unterzeichnet der Autor das Dokument mit seiner digitalen Signatur, wodurch der Empfänger die Authentizität des Urhebers feststellen kann. Dabei kann der Informationsempfänger auch jeden Autor mit unterschiedlichen Graden an Glaubwürdigkeit versehen. Dadurch werden Beiträge des Autors mit höherem Glaubwürdigkeitsgrad einem Beitrag eines Autor mit niedrigerer Glaubwürdigkeit vorgezogen.
5 Anwendungsmöglichkeiten
Das einfachste, aber beliebteste Anwendungsszenario ist der Terminkalender. Dabei können Terminkalender verschiedener Benutzer nach einem Terminwunsch eines Benutzers anhand ihrer Daten selbständig Termine aushandeln. Dieses Beispiel wird in der Praxis schon recht häufig benutzt. Herausgeber entsprechender Semantic Web Lösungen für Terminkalender stellen im Internet Synchronizationswerkzeuge für alle gängigen Personal Digital Assistants (PDA) und Groupwareplattformen bereit.
Wesentlich nützlicher und komplexer ist z. B. eine Reiseplanungs- und Buchungssystem. Eckpunkte eines Reiseagenten wären dabei ein Netzwerk von URI´s mit aktuellen Ressourcen wie Flugplänen, Tarifen, usw. sowie eine Wissensdatenbank (Ontologie) mit entsprechender Klassifizierung und entsprechenden Inferenzen, wie z. B. Berlin liegt in Deutschland, bestehen. Auch die Nutzerpräferenzen sollten als Instanz der Ontologie vorliegen. Das System könnte über diese Aufbau nach Angabe des Reiseziels und des Datums die Arbeit einer Sekretärin im Hinblick auf die Reiseplanung verrichten (vgl. /Euz-02/).
6 Kontrollfragen
1. Welche Gründe führten zur Entwicklung des Semantic Web ?
2. Welche drei Technologien bilden die Grundlage für das Semantic Web ?
3. Welche Bedeutung haben die Tripels des Resource Description Frameworks ?
4. Was sind Ontologien ?
Abkürzungsverzeichnis
Abbildung in dieser Leseprobe nicht enthalten
Literatur
/Ger-03/ Geroimenko, Vladimir und Chen, Chaomei (Hrsg.): Visualizing the Semantic Web – XML – based Internet and Information Visualization, London, 2003
/c´t-02/ Heise, Christian (Hrsg.): c´t Magazin für Computertechnik Heft 6/2002, S. 132 ff. Hannover, 2002
/Wah-00/ Wahrig-Burfeind, R. (Hrsg.): Wahring Fremdwörterlexikon. Gütersloh / München, 2000
Quellen aus dem Internet
/Ber-01/ Berners-Lee, Tim: Semantic Web Activity Statement, Stand: 20.12.2003,
http://www.w3c.org/2001/sw/Activity
/Cer-03/ Conseil Européen de Recherches Nucléaires: About us, Genf, Stand: 12.12.2003, http://public.web.cern.ch/public/about/aboutCERN.html
/Euz-02/ Euzenat, Jerôme, A Few Words about the Semantic Web in ERCIM News Nr. 51, Sophia Antipolis (Frankreich), Stand: Oktober 2002,
http://www.ercim.org/publication/Ercim_News/enw51/
/Guh-01/ Guha, R. V., Semantic Web in Industry, Stand: 17.12.2003,
http://www.w3.org/2003/Talks/0522-swinf-guha/SWInRealWorld.ppt
/Hef-03/ Heflin, Jeff: OWL Ontology Language Use Cases and Requirements (W3C Proposed Recommendation 2003-12-15, Stand: 04.01.2004,
http://www.w3c.org/TR/2003/PR-webont-req-20031215/
/Kly-03/ Klyne, Graham und Carroll, Jeremy J.: Resource Description Framework – Concepts and Abstract Syntax (W3C Proposed Recommendation 2003-12-15), Stand: 04.01.2004 http://www.w3c.org/TR/2003/PR-rdf-concepts-20031215/
/McG-03/ McGuinness, Deborah L. und van Harmelen, Frank: OWL Web Ontology Language – Overview (W3C Proposed Recommendation 2003-12-15), Stand: 04.01.2004
http://www.w3c.org/TR/2003/PR-owl-features-20031215/
/Net-03/ Akademie.de asp GmbH (Hrsg.): Netlexikon, Berlin, Stand: 12.12.2003,
Häufig gestellte Fragen
Was ist das Semantic Web?
Das Semantic Web ist eine Erweiterung des World Wide Web, die darauf abzielt, Informationen maschinenlesbar zu machen. Es ermöglicht Computern, den Inhalt von Webseiten besser zu verstehen und zu verarbeiten, um so intelligentere Anwendungen und Dienste zu ermöglichen.
Welche Technologien bilden die Grundlage für das Semantic Web?
Die Haupttechnologien, auf denen das Semantic Web aufbaut, sind XML (eXtensible Markup Language), RDF (Resource Description Framework) und Ontologien.
Was ist XML und welche Rolle spielt es im Semantic Web?
XML (eXtensible Markup Language) dient als genereller Standard für die Syntax aller Technologien im Rahmen des Semantic Web. Es ermöglicht die Definition strukturierter Daten und erleichtert den Datenaustausch.
Was ist RDF und welche Bedeutung haben die Tripels des Resource Description Frameworks?
RDF (Resource Description Framework) dient zur Formulierung von Sachverhalten auf maschinenlesbaren Internetseiten. RDF verwendet Tripel, die aus Subjekt, Prädikat und Objekt bestehen. Das Prädikat beschreibt die Beziehung zwischen Subjekt und Objekt. Diese Tripel ermöglichen es, Beziehungen zwischen verschiedenen Ressourcen darzustellen und zu verknüpfen.
Was sind Ontologien und warum sind sie wichtig für das Semantic Web?
Ontologien sind formale Repräsentationen von Wissen über ein bestimmtes Gebiet. Sie definieren Begriffe, Konzepte und Beziehungen und ermöglichen es, Informationen zu klassifizieren, zu strukturieren und zu verknüpfen. Ontologien sind wichtig, um Inkonsistenzen zu vermeiden und eine gemeinsame Bedeutung von Begriffen sicherzustellen, was die Effektivität der Suche und des Datenaustauschs erhöht.
Welche Arten von Beziehungen können durch Ontologien dargestellt werden?
Ontologien können verschiedene Arten von Beziehungen darstellen, darunter Äquivalenzbeziehungen (Erkennung gleichbedeutender Begriffe), Taxonomien (Gliederung und Klassifizierung von Elementen) und Inferenzregeln (Folgerungen basierend auf taxonomischen Beziehungen).
Was sind Inferenzregeln und wie funktionieren sie im Semantic Web?
Inferenzregeln bauen auf Taxonomien auf und ermöglichen es, aufgrund der hierarchischen Einordnung von Taxonomien Folgerungen zu ziehen. Sie ermöglichen es Maschinen, neues Wissen zu generieren, indem sie Beziehungen zwischen Konzepten und Objekten herstellen.
Welche Beispiele für Anwendungen des Semantic Web werden im Text genannt?
Der Text nennt als Beispiele einen Terminkalender, der selbständig Termine aushandeln kann, und ein Reiseplanungs- und Buchungssystem, das die Arbeit einer Sekretärin im Hinblick auf die Reiseplanung verrichten kann.
Welche datenschutzrechtlichen Probleme könnten mit dem Semantic Web verbunden sein?
Das Semantic Web könnte datenschutzrechtliche Probleme mit sich bringen, insbesondere im Hinblick auf die Glaubwürdigkeit des Urhebers von Informationen und die Möglichkeit, persönliche Daten umfassend zu verknüpfen. Der Text erwähnt auch das Problem nicht vertrauenswürdiger Ressourcen.
Wie kann die Glaubwürdigkeit von Informationen im Semantic Web sichergestellt werden?
Die Glaubwürdigkeit von Informationen kann durch digitale Signaturen des Autors sichergestellt werden, wodurch der Empfänger die Authentizität des Urhebers feststellen kann. Zudem können Nutzer und Autoren Vertrauensstellungen definieren, wobei Beiträge von Autoren mit höherem Glaubwürdigkeitsgrad bevorzugt werden.
- Quote paper
- Andreas Hofstetter (Author), 2004, Semantic Web - Das Web für Maschinen, Munich, GRIN Verlag, https://www.grin.com/document/108942