Der theoretische Teil der vorliegenden Arbeit stellt die verschiedenen Aspekte
semantischer Netze dar. Dies sind zum einen das Konzept semantischer Netze und
zum anderen Nutzungskonzepte allgemeiner Art. Das im praktischen Teil zu
verwendende Modellierungswerkzeug K-Infinity der Firma intelligent views GmbH wird
beschrieben und auf dessen Besonderheiten im Hinblick auf die Implementierung des
Topic Map-Standard eingegangen. Klassifikationen und andere Hilfsmittel, die als
Hilfestellung zur Begriffsfindung bei der Beschreibung der zu generierenden Klassen
dienen, werden vorgestellt. Aspekte inhaltlicher und formaler Repräsentation von
Dokumenten im Allgemeinen und in Bezug auf Lernobjekte im Besonderen werden in
Kapitel 2.3 vorgestellt.
Der praktische Teil der vorliegenden Arbeit besteht im Aufbau eines semantischen
(Teil-) Netzes mit Hilfe der Modellierungssoftware K-Infinity. Dies geschieht in
Anlehnung an Begriffe und Relationen des durch Herrn Prof. Dr. G. Knorz zum
Zeitpunkt der Erstellung dieser Arbeit bereits teilweise modellierten Demonstrators3. Es
repräsentiert Teile der FH Darmstadt. Die zu diesen Zweck zu erstellenden Klassen
sollen den Zugang der Nutzer zu den Lehrveranstaltungen des Fachbereiches
Information und Wissensmanagement: „Klassifikationen“, „Indexierung und
Thesaurus“ sowie „Information Retrieval“ und deren Materialien sowie die Verwaltung
der Lehr-Lernmaterialien der entsprechenden Online-Lehrveranstaltungen
ermöglichen. Analog dazu sollen für alle Fachbereiche der FH Darmstadt die
Wissensgebiete auf einer eher formalen Ebene bearbeitet werden.
Erklärung
Darmstadt, 14.06.2002 _____________________________________________
Student: ____________________________________________
Darmstadt, den 14.06.2002
Vorbemerkung
E-learning war in diesem Jahr das dominierende Thema der Learntec-Messe in Karlsruhe und eines der Schwerpunktthemen der Bildungsmesse 2002 in Köln. Dies scheint der vorläufige Höhepunkt einer bereits seit Jahren bestehenden Entwicklung zu sein. Dass Hochschulen an dieser aktuellen Entwicklung Teil haben wollen ist nur natürlich, da insbesondere das Selbststudium bzw. das selbstgesteuerte Lernen ohnehin integraler Bestandteil der Mehrzahl der konventionellen Studiengänge sein dürfte. Sichtbares Zeichen dieser Entwicklung ist die ständige Vergrößerung des Angebotes an virtuellen Lehrveranstaltungen, Studiengängen und die Eröffnung virtueller Hochschulen. Das Angebot virtueller Lehrveranstaltungen setzt freilich mehr voraus als die Präsentation einzelner Texte oder Videodateien via Internet. Erforderlich ist eine ausgeprägte Strukturierung, die neben inhaltlichen auch Aspekte von organisatorischer und rechtlicher Relevanz zu berücksichtigen hat. Was liegt näher, als die an einer Hochschule etablierte Infrastruktur zusammen mit der neu zu schaffenden, virtuellen Lehr- und Lernwelt abzubilden?
1 Einleitung
Zum Konzept einer virtuellen Hochschule gehören alle für die Studierenden relevanten Funktionen einer Hochschule. Dazu zählen Kommunikationsmöglichkeiten zur Unterstützung sozialer Kontakte zwischen Studierenden und zur Unterstützung von Gruppenarbeit und Seminaren (kooperatives Lernen), Informations- und Beratungssysteme (Tutor, Dozent), der Zugang zu einer Bibliothek mit digitalen Medien und die Einbindung aller verwaltungsbezogenen Abläufe. Als Lehrmaterialien werden „Computer Based Trainings“ (CBT), Videosequenzen, Animationen, Simulationen, Foliensequenzen und Textkurse verwendet. Die Lehrmaterialien stehen als hypermediale Dokumente zur Verfügung. Lehr-Lernmodule mit großen Dateien und umfangreiche Texte können als CD-ROM bzw. als Text verschickt werden. Sie sind nach didaktischen und thematischen Gesichtspunkten miteinander verknüpft. Zur Realisierung einer virtuellen Hochschule gehört die Entwicklung einer homogenen Lehr-Lernplattform, die dem Nutzer eine individuelle Sicht auf den komplexen Informationsraum „Hochschule“ mit Hilfe seines Heimcomputers via Netzwerktechnik bzw. Internet ermöglicht. So ist den Studierenden der Zugriff jederzeit und von (fast) jedem Ort aus möglich. (Vgl. [Sch] und [Bru 2001])
Unter Federführung der FH Darmstadt wird in Kooperation mit anderen Hochschulen im Rahmen des Hochschulförderprogramms „Neue Medien in der Bildung“ das Projekt „2MN - Module für die multimediale netzbasierte Hochschullehre“ durchgeführt. Ziel des Projektes ist die Entwicklung modularer multimedialer Lehrangebote zur wissenschaftlichen Ausbildung bzw. Weiterbildung in ingenieurwissenschaftlichen Fachdisziplinen und den Informationswissenschaften. Die Lehrangebote sollen so konzipiert sein, dass sie sowohl als Präsenzstudium als auch im Fernstudium durchführbar sind. Im Rahmen des Projektes wird eine Lehr-Lernplattform (ELAT - Environment for Learning and Teaching) entwickelt. ELAT realisiert die oben beschriebenen Funktionen, die eine solche Umgebung im Rahmen einer virtuellen Hochschule bereitstellen sollte. Ein besonderes Merkmal der Plattform ist ihre offene Konzeption, die die Option offenhält, zu einem späteren Zeitpunkt erstellte, weitere Lehr-Lernmodule zu integrieren. Die im Zusammenhang mit dieser Arbeit relevanten Lehr-Lernmodule sind der Fachdisziplin Informationswissenschaft zuzuordnen. Im Einzelnen handelt es sich um die Lehrveranstaltungen „Indexieren und Thesaurus“, „Information Retrieval“ sowie „Klassifikation“. Die Konzeption der Lehr-Lernmodule sieht vor, dass die Lehrinhalte mehrfach kombiniert werden können. Dies ist
Einleitung 5
Auch wenn im Sinne einer Optimierung eine Überführung der heterogenen in eine homogene Informationsinfrastruktur wünschenswert wäre, so ist sie für sich genommen nicht zwingend notwendig.
Die Einführung bzw. Implementierung einer virtuellen Hochschule an einer bereits bestehenden realen Hochschule muss, soll sie den allgemeinen Anforderungen an eine virtuelle Hochschule genügen, Zugriff auf Ressourcen verschiedener organisatorischer Einheiten ermöglichen. Die virtuelle Hochschule benötigt ihrerseits eine eigene homogene, digitale Informationsinfrastruktur respektive einer Verwaltung der Ressourcen und ihrer Nutzer. Beim Aufbau einer virtuellen Hochschule im Rahmen einer realen Hochschule gibt es demnach drei Möglichkeiten: Erstens der Aufbau einer zusätzlichen digitalen Infrastruktur im Sinne einer separaten „Insellösung“ unter paralleler Beibehaltung der alten Informationsinfrastruktur; zweitens die Möglichkeit der Einbeziehung der bestehenden Informationsinfrastruktur in die ohnehin neu aufzubauende digitale Infrastruktur im Sinne einer Integration und drittens der völlige Neuaufbau einer Informationsinfrastuktur unter Berücksichtigung aller Aspekte und Anforderungen sowohl der virtuellen als auch der „realen“ Hochschule. Dies hätte den zusätzlichen Vorteil, dass die reale Hochschule von der neuen zu errichtenden Infrastruktur im Sinne einer Optimierung profitieren könnte.
Einleitung 6
eine inhaltliche Nähe zueinander aufweisen, miteinander in Verbindung gebracht werden können. Sie müssen neben inhaltlichen Aspekten nach formalen und didaktischen Gesichtspunkten gruppiert oder einander zugeordnet werden können. Dazu ist eine formale und inhaltliche Repräsentation aller Dokumente (Dateien) notwendig. Aufgrund formaler und didaktischer Abhängigkeiten der Dokumente untereinander ist die Möglichkeit zur Reihenfolgemodellierung in Bezug auf die Gruppierung der Dokumente notwendig. Bei Videodateien und Animationen wäre die Möglichkeit, bestimmte Sequenzen auswählen und direkt anspringen zu können, hilfreich. Geht man von einem modularen Aufbau und einer multiplen Verwendbarkeit der Lerneinheiten aus, ist dies sogar zwingend erforderlich [KOM 2001].
Eine Möglichkeit zur Implementierung einer digitalen Informationsinfrastruktur, die die gewünschten Anforderungen erfüllen kann, ist die Repräsentation relevanter Aspekte der FH Darmstadt in Form eines Wissensnetzes (semantisches Netz). Die für die virtuelle Hochschule notwendige semantische Verknüpfung der Dokumente (Lernobjekte) (vgl. [Bru 2001, S. 97]) könnte durch die begriffliche Umschreibung der Lehrinhalte im Sinne einer Klassifikation wirksam unterstützt werden. Die Implementierung eines semantischen Netzes könnte ferner zur Abbildung der gewachsenen Infrastruktur der realen Hochschule dienen. Ein konkreter Vorteil wäre zum Beispiel der assoziative Zugang zu den wissenstragenden Einheiten der FH Darmstadt. Aspekte, gleich welcher Art, und die ihnen zugeordneten Dokumente, die zu anderen Dokumenten in irgendeiner Art von Beziehung stehen, könnten ohne Schwierigkeiten ausfindig gemacht werden. Ermöglicht würde für Nutzer eine Transparenz des „Systems FH Darmstadt“ 2 in dem Sinne, dass implizit vorhandene
Einleitung 7
1.1 Die Aufgabenstellung
Der theoretische Teil der vorliegenden Arbeit stellt die verschiedenen Aspekte semantischer Netze dar. Dies sind zum einen das Konzept semantischer Netze und zum anderen Nutzungskonzepte allgemeiner Art. Das im praktischen Teil zu verwendende Modellierungswerkzeug K-Infinity der Firma intelligent views GmbH wird beschrieben und auf dessen Besonderheiten im Hinblick auf die Implementierung des Topic Map-Standard eingegangen. Klassifikationen und andere Hilfsmittel, die als Hilfestellung zur Begriffsfindung bei der Beschreibung der zu generierenden Klassen dienen, werden vorgestellt. Aspekte inhaltlicher und formaler Repräsentation von Dokumenten im Allgemeinen und in Bezug auf Lernobjekte im Besonderen werden in Kapitel 2.3 vorgestellt.
Der praktische Teil der vorliegenden Arbeit besteht im Aufbau eines semantischen (Teil-) Netzes mit Hilfe der Modellierungssoftware K-Infinity. Dies geschieht in Anlehnung an Begriffe und Relationen des durch Herrn Prof. Dr. G. Knorz zum Zeitpunkt der Erstellung dieser Arbeit bereits teilweise modellierten Demonstrators 3 . Es repräsentiert Teile der FH Darmstadt. Die zu diesen Zweck zu erstellenden Klassen sollen den Zugang der Nutzer zu den Lehrveranstaltungen des Fachbereiches Information und Wissensmanagement: „Klassifikationen“, „Indexierung und Thesaurus“ sowie „Information Retrieval“ und deren Materialien sowie die Verwaltung der Lehr-Lernmaterialien der entsprechenden Online-Lehrveranstaltungen ermöglichen. Analog dazu sollen für alle Fachbereiche der FH Darmstadt die Wissensgebiete auf einer eher formalen Ebene bearbeitet werden.
Alternative Möglichkeiten zur Integration von Dokumentenrepräsentation und semantischen Netzen werden im auswertenden Teil der Arbeit vergleichend dargestellt.
Einleitung 8
1.2 Vorgehensweise
Die Vorgehensweise bei der Durchführung des praktischen Teils dieser Arbeit ist, formal betrachtet, folgende:
• Identifikation des Diskursbereiches, Analyse der Rahmenbedingungen und Beschreibung der Anforderungen an die durchzuführende Modellierung
• Identifikation eines geeigneten Vokabulars (zum Beispiel: Klassifikationen aus dem Bereich Bibliothek, Datenbank oder Institutionen, die Hochschulen übergeordnet sind) und Modifikation desselben entsprechend den Anforderungen
• Erstellen des Begriffssystems unter Berücksichtigung von Abhängigkeiten (Konzept-Topics, Assoziationen) und Benennung bzw. Aufstellung von Instanz-Topics
• Aufstellung und Etablierung der Assoziationen
• Probeweises Zuordnen von Informationsressourcen
2.1.1 Grundlagen
Unter dem Begriff „semantische Netze“ versteht man netzartig konzipierte Formate zur Wissensrepräsentation. Mit Hilfe dieses Konzeptes lässt sich ein Wissensgebiet, also ein Ausschnitt der realen Welt, begrifflich darstellen. Dies geschieht durch Verknüpfung der eingeführten Begriffe mit Hilfe formal oder thematisch definierter Beziehungen.
Der Beginn theoretischer Überlegungen und Experimente zur Entwicklung semantischer Netze geht auf die Forschung zur künstlichen Intelligenz in den sechziger Jahren des vergangenen Jahrhunderts zurück. Hintergrund waren kognitionspsychologische Annahmen zur Funktionsweise des menschlichen Gedächtnisses. In diesem Zusammenhang sind Assoziationsmodelle gemeint, bei denen man davon ausgeht, dass im Gedächtnis gespeicherte Konzepte über Verbindungen zu anderen Konzepten verfügen. Wird ein solches im Gedächtnis gespeichertes Konzept durch einen Erinnerungsvorgang aktiviert, kommt es zur Aktivierung der Verbindungen und dadurch wird es möglich, die verbundenen Konzepte ebenfalls zu erinnern (vgl. [Rei 1991, S. 79]). Die dem ursprünglich aktivierten Konzept am nächsten liegenden Konzepte werden durch den Erinnerungsvorgang miteinander assoziiert (Verkettung). 4
Visualisiert kann ein solches Assoziationsmodell als Netzwerk mit Knoten und Kanten dargestellt werden. Die Knoten stehen dabei für die Konzepte (Begriffe) und die Kanten für deren assoziative Beziehungen. Die Gestaltung der potentiellen Aussagefähigkeit eines semantischen Netzes wird durch die Definition der Relationen, die die Qualität der Assoziationen im Netz ausmachen sollen determiniert (vgl. [Wei 2000, S. 24]). Eine Möglichkeit ist es, diesen Assoziationen keine inhaltliche Bedeutung
Theoretische Grundlagen und Hilfsmittel 10
Die beschriebenen Assoziationsmodelle gehen von folgenden Voraussetzungen aus (vgl. [Rei 1991])
• Wissen wird in Netzwerken von Begriffen gespeichert.
• Die primäre Zuordnung von Begriffen folgt klassischen Abstraktionsrelationen.
• Es gilt das Prinzip der Vererbung von Eigenschaften: Alle Eigenschaften von Begriffen höherer Ebenen gelten für die darunter liegenden Ebenen ebenfalls.
• Semantische Nähe von Begriffen ist ein Faktor zur Relevanzbeurteilung in Bezug auf den Gegenstand der Betrachtung.
Der formale Aufbau eines semantischen Netzes folgt den beschriebenen Annahmen. Die Darstellung der enthaltenen Aussagen geschieht modellhaft als gerichteter Graph. Begriffe, Konzepte und Objekte, angereichert mit zusätzlichen Eigenschaften, bilden die Knoten. Sie sind semantische Einheiten, die durch Relationen mit anderen Knoten des Netzes oder Objekten (Informationsobjekte) außerhalb des Netzes in Verbindung stehen können. Die Relationen werden als gerichtete Kanten realisiert.
Theoretische Grundlagen und Hilfsmittel 11
• Abstraktionsrelation (Ober-Unterbegriffsrelation)
• Instanzrelationen
• Partitivrelation (Teil-Ganzes-Relation)
Neben diesen formalen Relationen gibt es noch eine andere Gruppe von Relationen: Thematische Relationen. Sie haben inhaltlich entsprechende Bedeutungen wie das modellierte Wissensgebiet.
Die Etablierung formal-logischer Relationen erlaubt Inferenz, das heißt die Erschließung von Wissen auf der Basis vorhandenen Wissens. Dies geschieht auf der Basis logischer Schlussfolgerungen nach festgelegten Regeln. Damit Inferenzregeln es gestatten können aus vorhandenem Wissen neues Wissen abzuleiten, müssen die im Netz eingeführten Begriffe korrekt und sorgfältig gewählt werden. Formale Regeln der Logik müssen bei der Etablierung der Relationen beachtet werden. Ungenaue oder falsche Einordnung der Begriffe in ein semantisches Netz oder die fehlerhafte bzw. ungenaue Etablierung der Relationen führen zu falschen Ergebnissen. Die strengen Anforderungen an formal-logische Kriterien einerseits und die Leichtigkeit der Einführung neuer Begriffe und Klassen andererseits beinhalten daher ein gewisses Risiko zur Schaffung von Inkonsistenz in einem semantischen Netz.
Theoretische Grundlagen und Hilfsmittel 12
• Deduktive Inferenz - spezielles Wissen wird aus allgemeingültigem Wissen abgeleitet.
• Induktive Inferenz - mehrere Wissenselemente ergeben eine allgemeingültige Aussage.
• Analoge Inferenz - der Lösungsweg eines Problems wird aus bekannten Lösungswegen eines alten Problems abgeleitet.
Strukturell besteht ein semantisches Netz aus zwei Ebenen: Der Konzeptebene (Ontologie) mit den Konzeptknoten von unterschiedlichem Abstraktionsgrad und den Individualknoten, die mit den Konzeptknoten durch Instanzrelationen verbunden sind. Zur ergänzenden (spezialisierenden) Erläuterung oder Modifikation von Begriffen dienen Eigenschaftsknoten. Sie teilen sich ebenfalls in Knoten der Konzeptebene und der Individualebene. Daher ist es notwendig, im Hinblick auf ihre Rolle in Bezug auf den Ausschnitt des abgebildeten Wissens Knoten in verschiedene Sorten zu gruppieren. Dementsprechend haben auch Relationen unterschiedliche Funktionen: Die Herstellung formal-logischer Bezüge zwischen den Begriffen, der Zuweisung von Eigenschaften entweder durch die Definition der Relationen selber oder durch die Zuweisung von Eigenschaftsknoten und die Herstellung themengebietsabhängiger, freidefinierbarer Relationen. Im Rahmen einer Visualisierung lassen sich Knoten als Kreise und Kanten als Pfeile darstellen.
Theoretische Grundlagen und Hilfsmittel 13
Konzeptebene
Abb 1: Ebenen semantischer Netze, Begriffssorten, Relationstypen
Legende:
Blaue Pfeile: thematische Relationen
Schwarze Pfeile: formal-logische Relationen
Abstraktionsrelation:
Partitivrelation:
Theoretische Grundlagen und Hilfsmittel 14
Damit ein semantisches Netz durch einen Rechner verarbeitet werden kann, müssen die Elemente aus denen es aufgebaut ist in ein Datenmodell überführt werden, mit denen ein Rechner umgehen kann. Dies kann beispielsweise mit Hilfe prädikatenlogischer Aussagen geschehen. Eine Implementierung wäre zum Beispiel mit Hilfe entsprechender Programmierung möglich (Prolog, Lisp). Die Vorstellung von semantischen Netzen als Modell einer Menge begrifflicher Entitäten, die durch qualifizierte Beziehungen miteinander verbunden sind, erinnern an das aus der Datenbanktheorie bekannte Entity Relationship-Modell.
2.1.2 Eigenschaften semantischer Netze
Die Tatsache, dass semantische Netze der Ausdrucksfähigkeit natürlicher Sprache relativ nahe kommen können [Wei 2000, S. 19], ermöglicht bei der Exploration des dargestellten Wissensgebietes einen direkten Zugang und ein assoziatives Vorgehen. Diese Vorgehensweise entspricht der intuitiven Vorgehensweise von Menschen. Dies wird zusätzlich dadurch unterstützt, dass die Möglichkeit der Visualisierung von Zusammenhängen und damit leichten Verständlichkeit bereits im Konzept selbst angelegt ist. So lässt sich einerseits entlang der Relationen im Wissensgebiet browsen, andererseits ermöglicht das direkte Anspringen der Begriffe innerhalb des semantischen Netzes die Suche nach Themengebieten. Aus der genauen Definition der Begriffe durch diese Verankerung resultiert eine effiziente terminologische Kontrolle. Durch Zuweisung beliebig vieler synonymer Benennungen lässt sich die Auffindbarkeit eines Themas sicherstellen. Semantische Netze ermöglichen auch Zugang zu Inhalten etwa literarischer Texte, die sich durch automatische Indexierung nicht erschließen lassen, da ihre tatsächlichen Inhalte oft nicht explizit formuliert sind [Schm 2000].
Große komplexe semantische Netze werden in Bezug auf die Visualisierung selbst auf großen Bildschirmen schnell unübersichtlich. Es kann also stets nur eine vorher getroffene Auswahl an Knoten bzw. ein gewählter Ausschnitt sinnvoll betrachtet und kognitiv erfasst werden. Daraus ergibt sich die Notwendigkeit, im Rahmen einer Anwendung semantischer Netze entsprechende Auswahl- und Recherchetools zur Verfügung zu stellen. Im Hinblick auf Retrieval und Erschließung eines Wissensgebietes ist der Nutzen für unerfahrene Nutzer möglicherweise größer als für Fachexperten. Fachexperten beherrschen die Terminologie ihres Fachgebietes. Sie haben, wenn für sie der Umgang mit fachlichen Informationen zur Bewältigung ihrer
Theoretische Grundlagen und Hilfsmittel 15
Das scheinbar einfache Konzept semantischer Netze verschleiert dessen tatsächliche Komplexität bei der Modellierung scheinbar einfacher Zusammenhänge in ein konkretes semantisches Netz. Der Vorteil eines semantischen Netzes, dass implizit vorhandene Sachverhalte explizit dargestellt werden, setzt umgekehrt voraus, dass bei der Modellierung implizites Wissen explizit ausgedrückt werden muss. So kann es passieren, dass aufgrund unpräziser Modellierung die Benennungen von Begriffen und Relationen eine Semantik suggerieren, die in der logischen Struktur des Netzes keine tatsächliche Entsprechung hat [Kno 2001a]. Das hätte zur Folge, dass die potentiellen Möglichkeiten der Inferenz nicht genutzt werden könnten (s. a. Kapitel: 2.1.1).
Die Erfassung der thematischen Zusammenhänge des modellierten Wissensgebietes kann derzeit nur durch Menschen geschehen. Darüber hinaus ist, neben guter fachlicher Kenntnis des modellierten Wissensgebietes, die Fähigkeit zur Modellierung eines solchen Netzes Voraussetzung. Aufbau und Pflege eines semantischen Netzes sind daher in der Regel nur durch geschultes Fachpersonal [Sig 2001a] leistbar und damit zeit- und kostenintensiv. Daraus lässt sich ableiten, dass die Anwendung eines semantischen Netzes nur dort effizient ist, wo ein Zuwachs an Nutzen in Form von Umsatzsteigerungen, Leistungserweiterungen oder Rationalisierung an anderer Stelle erzielt werden kann.
Der vielleicht größte Nutzen bei der Anwendung semantischer Netze ist die gleichzeitige Unterstützung sehr spezieller Aufgaben bei gleichzeitiger potentieller Universalität. So können beispielsweise in einer Organisation Verwaltungs- und Produktionsaufgaben gleichermaßen bewältigt werden. Einen Überblick über mögliche Nutzungskonzepte gibt das folgende Kapitel. Für verschiedene Aufgaben lassen sich Teilnetze aufbauen, die sich später zusammenfügen lassen.
2.1.3 Mögliche Nutzungskonzepte
Mögliche Nutzungskonzepte für semantische Netze nach dem Topic Map-Standard oder standardkonforme Systeme wie K-Infinity der Firma intelligent views GmbH lassen sich in Anlehnung an das Kapitel 2.1.2 nach verschiedenen Aspekten einteilen:
• Allgemeine Nutzungsmöglichkeiten
• Anwendungsbezogene Nutzungsgebiete
Theoretische Grundlagen und Hilfsmittel 16
Jeder Aufzählungspunkt der folgenden Auflistung berücksichtigt jeweils alle oben genannten Aspekte. Optionen im Hinblick auf Hochschule respektive virtuelle Hochschule werden explizit erwähnt. Eine Ausnahme bildet der letzte Punkt: Konkrete Nutzungsbeispiele.
Da es sich bei einem semantischen Netz lediglich um ein Konzept handelt, setzt die Realisierung nachfolgend erwähnter Möglichkeiten die Implementierung des Konzeptes in Form geeigneter Anwendungen voraus.
• Retrievalwerkzeug (Recherchehilfe)
Ein semantisches Netz kann als Zugangsmöglichkeit eines Wissensspeichers im Sinne eines semantischen Retrievals dienen. Dies könnte sowohl im Bereich der Fachinformation als präzises Suchwerkzeug als auch bei der Unterstützung unerfahrener Rechercheure durch die Unterstützung assoziativen Vorgehens nutzen. Beide Nutzergruppen dürften sowohl in der Privatwirtschaft als auch an Hochschulen zu finden sein. Durch die Möglichkeit grafischer Darstellung (Visualisierung) von Zusammenhängen eines Wissensgebietes könnte ein semantisches Netz unterstützend zum Lernen bzw. Erfassen komplexer fachlicher Zusammenhänge eingesetzt werden 7 . Dazu könnte die explorative
Suchmöglichkeit entlang der Kanten des semantischen Netzes genutzt werden. Dies würde das Konzept selbstgesteuerten Lernens, das jedem virtuellen Lehrangebot zugrunde liegt, nachhaltig unterstützen. Denkbar wäre in diesem Sinne auch eine Funktion als Weiterbildungsmedium für Mitarbeiter großer oder dezentral aufgebauter Organisationen.
Die Verwaltung von Dokumentenbeständen lässt sich im Wesentlichen durch zwei Aufgabenbereiche charakterisieren. Zum einen müssen Dokumente verschiedener Art im Rahmen sinnvoller Strukturen abgelegt werden. Zum anderen muss ihre Wiederauffindbarkeit gesichert werden. Beide Aspekte sind im Hinblick auf die Arbeit im Rahmen einer virtuellen Lehr-Lernplattform von Bedeutung: Es werden Dokumente produziert und eingestellt - von den Lehrenden sowie den Lernenden. Ferner werden Dokumente entsprechend der zu bewältigenden Aufgabenstellung gesucht. Ergänzend könnte hier die Dokumentation von Forschungsarbeiten oder Projekten genannt werden. Ein weiterer möglicher Anwendungsbereich wäre die technische Dokumentation oder die Dokumentation von Softwareprojekten.
Theoretische Grundlagen und Hilfsmittel 17
Durch die Schaffung von Transparenz in Bezug auf vorhandene Wissensbestände (Implizites wird explizit) findet neben der Verminderung von Redundanz auch eine Standardisierung von Wissen innerhalb einer Organisation statt. In diesem Zusammenhang passt zum Beispiel die Darstellung von Aufbau- und Ablauforganisation im Sinne eines Organigramms. Wissensmanagement im weitesten Sinne und die Entscheidungsunterstützung von Entscheidungsträgern in Organisationen könnte wirksam unterstützt werden.
Für Studienteilnehmer, die nicht am Ort des Trägers einer virtuellen Hochschule wohnen, kann es hilfreich sein, Aufbau und Struktur ihrer Bildungseinrichtung zu kennen oder kennen zu lernen. (Gleiches gilt selbstverständlich für alle anderen Menschen, die mit einer Hochschule zu tun haben.)
Alle Personenangaben von Mitgliedern bzw. Mitarbeitern einer Hochschule könnten analog einem herkömmlichen Datenbanksystem erfasst und verwaltet werden. Gemäß dem Konzept des semantischen Netzes kann ihre Einbindung entsprechend ihrer Aufgaben dargestellt werden. Die Vergabe differenzierter Zugriffsrechte 8 müsste von der verwendeten Applikation unterstützt werden.
Es könnten Verzeichnisse nach Bedarf erstellt werden. Denkbar wären im Hochschulbereich beispielsweise angebotene Dienstleistungen wie Vorlesungen, Seminare, Prüfungen, wissenschaftliche Projekte und thematische Arbeitsfelder einer Hochschule. Ein semantisches Netz könnte aber auch (in Teilen) selber Index sein, zum Beispiel in Form eines Metadaten-Containers zur Auszeichnung elektronisch adressierbarer Informationsobjekte aller Art. Eine mögliche Art der Anwendung wäre zum Beispiel als Hilfsmittel zur Sacherschließung. Lehr-Lernmaterialien genauso wie die zu vermittelnden Lehrinhalte könnten durch Verknüpfung im semantischen Netz einer (virtuellen) Hochschule inhaltlich beschrieben und zugänglich gemacht werden. Die Realisierung von semantischem Markup könnte dabei unterstützend wirken. Denkbar wäre in diesem Zusammenhang auch die Verwaltung und Katalogisierung der Medien einer Hochschulbücherei.
Im Kontext dafür geeigneter Anwendungen lässt sich zum Beispiel ein strukturiertes Verzeichnis der zu einem Fach- oder Themengebiet gehörenden Lehrinhalte automatisch erstellen (vgl. [KOM 2001]).
Theoretische Grundlagen und Hilfsmittel 18
Die heterogene Informationsinfrastruktur einer Hochschule könnte mit Hilfe eines semantischen Netzes verknüpft werden. So könnte ein zentraler Zugang zu allen relevanten Informationsquellen oder Datenquellen (auch externer Informationsbestände) realisiert werden. Im Rahmen einer Aufgaben- und Kompetenzverteilung bei der Erstellung von Lehrinhalten zur virtuellen Lehre könnte ein zentraler Zugang (Zugriff) mit einem nahezu vollständigen Fächerangebot etabliert werden. Jede Hochschule könnte ihre fachlichen Schwerpunkte zum Projekt einbringen. Durch die Möglichkeit zur Verknüpfung von Informationsobjekten via Netzwerktechnik mit Hilfe von Hyperlinks bietet ein semantisches Netz einen zentralen Einstiegspunkt zum Auffinden von Informationen oder Wissen. Vielleicht ist das Integrationspotential sogar der größte Vorteil eines semantischen Netzes im Rahmen mancher Anwendungen.
Der Bereich Contentmanagement betrifft in erster Linie Organisationen, deren Unternehmenszweck es ist mit Publikationen Geld zu verdienen. Semantische Netze kommen hier u. a. als Hilfsmittel zur Publikationsverwaltung und Produktion zum Einsatz. Insbesondere das wissensbasierte Publizieren, die Mehrfachverwertung gleicher Inhalte zur Publikation mittels verschiedener Medien (Content Syndication) und vielleicht in Zukunft das Digital Rights Management wären hier zu nennen. Bei der Verwaltung von Sachwissen etwa in Form von (Fach-) Lexika, Enzyklopädien oder linguistischem Wissen wie der Verwaltung (mehrsprachiger) Wortschätze kommt einem semantischen Netz eine zentrale Bedeutung zu. Die Mehrsprachigkeit eines Wortschatzes kann als Instrument zur automatischen Übersetzung genutzt werden.
An Hochschulen entsteht durch Forschung und Promotion eine nicht unbeträchtliche Zahl wissenschaftlicher Publikationen. Deren Verwertung, insbesondere im Hinblick auf Mehrfachverwertung sowie die Wahrung der geistigen Eigentumsrechte, könnten möglicherweise mit Hilfe eines semantischen Netzes organisiert werden.
Theoretische Grundlagen und Hilfsmittel 19
• Der themenbezogene Nachrichtenservice (Auto, Gesundheit) des Zimpel Verlages exklusiv für Journalisten 9
• Der Net Guide 10 (Verzeichnis von Internetquellen) des Focus Magazins
• Die enzyklopädischen Datenbanken von wissen.de und xipolis.net
• Der Brockhaus Duden
• Die CD ROM-Ausgabe des Fischer Weltalmanachs
• Die "Große Kommentierte Frankfurter Ausgabe" der Werke Thomas Manns als Buchausgabe und CD-ROM des Fischer Verlages [Schm 2000]
• Virtuelles Lehrangebot der FH Darmstadt (im Mai 2002 noch im Aufbau) [Kno 2001]
• Informationsangebote der Pressetext Austria AG 11
2.1.4 Das Konzept Topic Map
Beim Topic Map-Standard handelt es sich um ein Konzept zum Aufbau semantischer Netze. Das Konzept sieht vor Klassen zu bilden und diese untereinander und mit ihren Instanzen zu verknüpfen. Qualität und Aussagen der Verknüpfungen sind frei definierbar. Durch diese freie Definierbarkeit ist es sehr flexibel einsetzbar. Es gestattet sowohl die Verwaltung und Retrieval real vorhandener Dokumentenbestände (Informationsobjekte) als auch die Modellierung von Ideen und Konzepten wie zum Beispiel das Organigramm einer Institution oder der Klassifikation eines Wissensgebietes. 1999 wurde das Konzept Topic Map von der International Organization of Standardization (ISO) mit der Nummer ISO/IEC 13250:2000 zum Standard erhoben [Rat 1999].
Theoretische Grundlagen und Hilfsmittel 20
Abb 2: Darstellung der Charakteristika: Topic, Association, Occurrence
Associations sind nicht gerichtet, d.h. dass die Aussage, die eine Association ermöglicht, nämlich zum Beispiel: Topic "A" ist-größer-als Topic "B" sich immer auch
Theoretische Grundlagen und Hilfsmittel 21
2.1.5 Das Datenformat XML-Topic Map
Als offenes Austauschformat für den Umgang mit Topic Maps (TM) und mit dem Ziel, TM für das Internet nutzbar zu machen, wurde von der TopicMaps.Org Authoring Group eine XML-DTD erstellt: XML Topic Maps (XTM) 1.0 [Top 2001]. Sie erfüllt die in den Spezifikationen von XML, Xlink und ISO 13250 genannten Vorgaben. Weitere Ziele bei Erstellung der DTD waren die Eindeutigkeit des bei der Anwendung entstehenden Codes und die Lesbarkeit für Menschen. Zur Realisierung des TM-Konzeptes in XML-Syntax werden 19 Elemente benötigt. Die Erläuterung aller Elemente der DTD soll aber im Rahmen dieser Arbeit nicht erfolgen. Für Details sei deshalb auf [Top 2001] verwiesen.
Auffällig ist, dass einige Topic-Charakteristika in XTM nicht 1:1 übernommen wurden. Sie müssen mit Hilfe der zur Verfügung stehenden Elemente und Konstrukte modelliert werden. Topic Type ist als Klasse-Instanz-Relation mit Hilfe des <instanceOf>- Elementes realisiert. Theme und Facet als solche gibt es nicht. XTM gibt aber die Möglichkeit, thematisch-inhaltliche Bezüge und Deklarationen mit Hilfe der Elemente <subjectIdentity> und <subjectIndicatorRef> herzustellen. Mit deren Hilfe werden die Public Subject Identifier (PSI) referenziert. Die Definitionen der wichtigsten Begriffe sind unter [Top 2001] zu finden. Die Charakteristika „Display Name“ und „Sort Name“ sind mit Hilfe der Elemente <variant> und <parameters> realisiert bzw. vorbereitet. Die entsprechenden Funktionen stellt XSLT im Rahmen einer Ausgabetransformation zur Verfügung. Das <mergeMap>-Element dient der Zusammenführung verschiedener TMs.
Zur besseren Anschaulichkeit gibt es einen einfachen, mit Kommentaren erläuterten XTM-Quelltext, der aus Gründen der Übersichtlichkeit in den Anhang auf S. 2 übernommen wurde.
Theoretische Grundlagen und Hilfsmittel 22
2.1.6 Die Software K-Infinity
K-Infinity der Firma intelligent views GmbH ist eine Gruppe von Anwendungen zur redaktionellen Bearbeitung und Administration von Wissensnetzen. Ein Wissensnetz ist eine netzartige Struktur von Begriffen und Relationen, die ein bestimmtes Wissensgebiet abbilden. Das zugrunde liegende Konzept entspricht dem eines semantischen Netzes. Der Aufbau der Anwendung K-Infinity entspricht dem Client-Serverprinzip und kann über TCP/IP-basierte Netzwerke genutzt werden. Zur grafischen Darstellung im Microsoft-Internetexplorer existieren entsprechende Java-Komponenten und ein browserkonformes Frontend. Die für Aufbau und Modifikation notwendige Komponente heißt Knowledge-Builder. Er besteht aus einem Organizer und einem Editor mit grafischer Oberfläche. Der Organizer dient der Organisation der zum Wissensnetz gehörenden Begriffe und der Rechtevergabe der Bearbeitungsrechte der Redakteure. Ferner verfügt er über ein Suchtool, mit dessen Hilfe der Begriffsindex durchsucht werden kann.
Es gibt drei Möglichkeiten der Suche:
• Zeichenkettensuche - durchsucht werden der Begriffsindex und der Index der Individuen des Wissensnetzes nach der eingegebenen Zeichenfolge
• Semantische Suche - durchsucht neben dem Begriffsindex den Index der so genannten Relationsbegriffe (Benennungen der Relationen) und listet die den gefundenen Begriffen durch Relationen assoziierten Begriffe mit auf. Basis ist auch hier ein Zeichenkettenvergleich
• Aufbau komplexer Suchfragen aus Kombinationen von Begriffen, Relationen und Individuen
Der Editor 12 dient der visuellen Unterstützung bei der Exploration des Netzes und der Einführung und Bearbeitung von Begriffen und Relationen. Verschiedene Arten von Begriffen oder Relationen lassen sich aufgrund verschiedener optischer Merkmale identifizieren.
Theoretische Grundlagen und Hilfsmittel 23
• Einfache Begriffe sind Knoten, die für das System keine spezielle Aufgabe erfüllen, hinsichtlich eines Netzkonzeptes aber als Konzeptknoten (im Sinne einer Ontologie) bezeichnet werden können.
• Individuen sind Instanzen von Begriffen. Sie können keine weiteren Instanzen haben.
• Individuenerweiternde Begriffe haben die Funktion, Individuen hinsichtlich ihrer Bedeutung näher zu spezifizieren
• Individuenfähige Begriffe haben die Funktion, Bezugsknoten für so genannte Individuen sein zu können (optionale Eigenschaft).
Mit Ausnahme der Individuen und der individuenerweiternden Begriffe kann die Fähigkeit ein Bezugsknoten für so genannte Individuen zu sein für alle einfachen Knoten definiert werden.
Das Datenmodell verfügt über einige Systemrelationen, also hinsichtlich ihrer Aussage und Funktion von K-Infinity unveränderbar festgelegten Relationen. Ferner gibt es die Möglichkeit, Relationen frei zu definieren. Basisrelationen, die von K-Infinity immer etabliert werden, wenn Begriffe in das System eingefügt werden, sind die Ober-Unterbegriffsrelationen 13 , die Instanzrelation zwischen Individuum und individuenfähigem Begriff und die Erweiterungsrelation zwischen Individuum und individuenerweiterndem Begriff.
Die grafische Darstellung der Knoten geschieht in Form von Kreisen, deren Aussehen je nach Kategorie verschieden ist. Die Relationen sind als Pfeile dargestellt. Die Art der Darstellung ist verschieden, je nach Funktion der Relation. Beim Mausover erscheint die Benennung der jeweiligen Relation analog zur Ausrichtung des Pfeils. Es gibt bidirektionale Relationen: Symmetrische Relationen, inverse Relationen sowie Halbrelationen, die nur in einer Richtung Gültigkeit haben.
Theoretische Grundlagen und Hilfsmittel 24
Das Attribut Name ist für jeden Begriff obligatorisch, da jeder Begriff ohnehin eine Benennung braucht. Als optionale Attribute stellt das System die Zuweisung von Synonymen und die Vergabe einer ID zur Verfügung. Synonyme werden in den Begriffsindex aufgenommen. Weitere Attribute müssen selbst definiert werden. Für neu definierte Attribute muss ein Datentyp (Datum, Integer, Zeichenkette, Hyperlinks u. a.) festgelegt werden. Optional ist die Möglichkeit der Mehrsprachigkeit von Attributwerten. Dies gibt dem Bearbeiter eines Wissensnetzes die Möglichkeit, eine Menge an Begriffen in Bezug auf ihre Bedeutung für mehrere Sprachen zu definieren.
Für den Import von Individuen, zum Beispiel für den Aufbau einer Personendatenbank, existiert die Möglichkeit des Imports und Exports von Daten im Excel-Format. Für den gleichen Zweck steht eine ODBC-Schnittstelle zur Verfügung. Zur Überführung des Wissensnetzes in andere Anwendungen gibt es die Möglichkeit des XML-Exportes. Die exportierte XML-Datei entspricht nicht dem XTM-Standard. Zur Datenübernahme in andere Anwendungen müsste ein Transformationsskript (XSLT) oder eine entsprechende Anwendung programmiert werden.
Eine weitere Komponente von K-Infinity zur redaktionellen Arbeit ist das Markup-Tool. Die Komponente ermöglicht das Anlegen von Textdateien im Wissensnetz bei gleichzeitiger Verknüpfung einzelner Zeichenketten, Zeichenkettenpassagen oder Textabschnitte mit Begriffen des Wissensnetzes. Es handelt sich also um die Möglichkeit des semantischen Markup (inhaltsbezogene Auszeichnung).
Binärdateien (MSWord, PDF) können ebenfalls mit Begriffen des Wissensnetzes verknüpft werden. Ein semantisches Markup von Teilen des Textes selber ist dann aber nicht möglich.
Theoretische Grundlagen und Hilfsmittel 25
2.1.7 K-Infinity und das Konzept Topic Map im Vergleich
In K-Infinity wurde laut Werbeaussage der Herstellerfirma intelligent views GmbH der Topic Map-Standard 14 umgesetzt. Nach den ersten Versuchen mit der Anwendung zu arbeiten kam beim Autor subjektiv das Gefühl auf, dass es sich nicht um eine konsequente Umsetzung des Topic Map Standards handelt. Letztlich erfüllt die Anwendung den Standard, die Implementierung verstellt nur hier und da den Blick dafür. Es sind viele Dinge bereits definiert, die sonst eigens mit Hilfe einer Ontologie festgelegt werden müssten. Konzeptionelle Festlegungen durch die Anwendung selbst, bzw. das durch die Entwickler vorgesehene Konzept, scheinen dem Geist des bewusst flexibel gehaltenen Topic Map-Standard zu widersprechen. Das Datenmodell legt zum Beispiel eine Baumstruktur fest und es muss auf jeden Fall eine konsistente Abstraktionshierarchie aufgebaut werden, bevor die für das modellierte Wissensgebiet relevanten, themenbezogenen Relationen eingefügt werden können. Dies oder die Art und Weise, mit der Informationsobjekte eingebunden werden, sind Festlegungen, die der Topic Map-Standard zwar nicht explizit vorsieht, ihm aber auch nicht widersprechen.
Zwei kleinere Unterschiede gibt es aber dennoch. Es können beliebige und beliebig viele Attribute für Begriffe definiert und etabliert werden. Dabei können die Datentypen fest definiert werden. Topic Map sieht zur Ausstattung eines Topics ein Set von sechs bzw. acht Attributen vor, deren Benennungen und Funktionen definiert sind. Der zweite Punkt betrifft die Einbindung der Informationsobjekte. Werden Informationsobjekte im System selbst erzeugt, sind sie Bestandteil desselben. Dies hat den Vorteil, dass semantisches Markup und eine Strukturierung der Texte auf Textabschnittsebene möglich wird ohne daraus auf komplex aufgebaute, externe XML-Dateien bzw. Teile referenzieren zu müssen. Für Topic Map sind Informationsobjekte stets eigenständige Objekte, die mit Hilfe dafür vorgesehener Strukturen (Association, Occurrence) referenziert werden. Dies ist vielleicht auch Ausdruck einer übergreifenden Philosophie. Das Topic Map-Konzept berücksichtigt explizit die Fähigkeit zur Interoperabilität. K-Infinity ist ein proprietäres System. Die Herstellerfirma legt laut Aussage einer Mitarbeiterin keinen Wert auf Interoperabilität
Theoretische Grundlagen und Hilfsmittel 26
Die Einhaltung bestimmter logischer Regeln (Abstraktionshierarchie) und die durch die verschiedenen Arten von Begriffen (Individuen, Begriff, individuenerweiternder Begriff, individuenfähiger Begriff, Dokumentenbegriff) und damit zwingend zu etablierenden Systemrelationen, dienen der Erhaltung der Konsistenz des Wissensnetzes und ermöglichen Inferenz. Die durch die Anwendung etablierten Festlegungen scheinen zwar restriktiv, sind aber letztlich der Nutzerunterstützung bei der redaktionellen Arbeit geschuldet. Außerdem muss selbst ein bewusst flexibel gehaltenes Konzept bei der Umsetzung in eine Anwendung sinnvoll initiiert werden. Grundlage des Kapitels sind neben [Int 2001] und [Int 2002] eigene Erfahrung durch die Benutzung der Software im Rahmen der im Kapitel 3 beschriebenen Bewältigung des praktischen Teils der vorliegenden Arbeit.
2.2.1 Grundlagen
Klassifikationssysteme sind Ordnungssysteme, mit deren Hilfe Informationsobjekte beschrieben und eingeordnet werden können. Sie sind Hilfsmittel zur Sacherschließung und bestehen aus einem System von Klassen, die durch hierarchische Zuordnung zueinander in Beziehung gesetzt werden.
Monohierarchische Klassifikationen kennen Abstraktionsrelationen (Oberbegriff- und Partitivrelationen (Teil-Ganzes-Relation) als Bindeglied zwischen den Klassen. Sie sind dadurch gekennzeichnet, dass jeder Begriff genau einen Oberbegriff hat. Die Begriffshierarchie entspricht in ihrem Aufbau einer Baumstruktur mit dem Wurzelelement an der Spitze. Alle Hierarchieebenen, die durch Abstraktionsrelationen miteinander verbunden sind, sind dadurch gekennzeichnet, dass ihre Klassen mindestens ein Merkmal mehr aufweisen als die darüber liegende Hierarchieebene. Die Anzahl der Merkmale nimmt von oben nach unten zu. Es handelt sich hierbei um eine analytische Klassifikation, bei der die hierarchische Einteilung der Klassen der Einteilung eines Wissensgebietes vom Allgemeinen zum Speziellen folgt. Eine Partitivrelation ist nach DIN 1463 eine „hierarchische Relation zwischen zwei Begriffen, von denen der übergeordnete Begriff einem Ganzen entspricht und der
Theoretische Grundlagen und Hilfsmittel 27
praktischen Anwendung kommen Mischformen vor.
Jede Klasse wird durch den merkmalsbestimmenden Begriff und seiner äquivalenten Benennung repräsentiert. Teil der Benennung ist die System abbildende Bezeichnung (Notation), die analog zur Klassenhierarchie das Notationssystem ausbildet. Die Notationen werden bei der Sacherschließung als inhaltskennzeichnende Merkmale (additiv) vergeben. Die Einteilung der Begriffe und Begriffskombinationen in ein solches System entspricht dem Prinzip der Präkombination. Durch die Möglichkeit einen Begriff mehreren Oberbegriffen zuzuordnen, entsteht eine Polyhierarchie mit der Möglichkeit bei einer Recherche mehrere Aspekte zu berücksichtigen. Im Gegensatz dazu kann innerhalb eines monohierarchischen Systems nur nach einem Aspekt gleichzeitig gesucht werden.
Eine flexiblere Art der Generierung eines Klassifikationssystems ist die Gruppierung geeigneter Merkmale in Form von Facetten. Diese Facetten stehen zur begrifflichen Qualifizierung allen Klassen des Systems zur Verfügung und können bei Bedarf miteinander kombiniert werden. Es handelt sich um analytisch-synthetische Klassifikationen. Sie ermöglichen bei der Erschließung von Wissensquellen ein postkoordinatives Vorgehen. Beide Typen von Klassifikationssystemen können miteinander kombiniert werden. Ein Beispiel für eine solche Kombination ist die internationale Dezimalklassifikation (DK). Die Zuteilung von Klassifikationsnotationen bei der Sacherschließung ermöglicht eine Gruppenbildung. Beim Retrieval mit Hilfe eines Oberbegriffs können alle abhängigen Begriffe gefunden werden. Klassifikationsnotationen sind in der Regel eindeutig und sind damit eine Form des semantischen Retrieval. Ein Nachteil ist die rigide Einteilung 16 , da ein Informationsobjekt in der Regel inhaltlich durch mehrere Klassen repräsentiert werden kann und die Einteilung meist relativ grob ist [Man 1997].
Theoretische Grundlagen und Hilfsmittel 28
2.2.2 Quellen zur Begriffsextraktion
Als Hilfsmittel zur Modellierung eines Wissensgebietes bietet es sich an, sofern vorhanden, eine bereits erarbeitete Fachklassifikation oder -systematik zu verwenden. Die Vorteile bei der Verwendung einer etablierten Klassifikation sind ihre bereits bewiesene Praxistauglichkeit, ihre Akzeptanz durch die jeweiligen Fachexperten und die Zeitersparnis, da sonst Zeit in Klassenbildung und Erarbeitung der Abstraktionshierarchie investiert werden müsste. Vor diesem Hintergrund recherchierte der Autor bei Institutionen, die sich mit Forschungsförderung und Administration im Bereich Hochschule 17 befassen, bei Datenbankhosts, dem Bereich der Universitätsbibliotheken sowie nach Fachsystematiken aus dem informationswissenschaftlichen Umfeld. Eine Klassifikation, die alle bekannten Fachrichtungen einer deutschen Hochschule abbildet, gibt es für den offiziellen Gebrauch offensichtlich nicht. Telefonische Anfragen oder E-Mails des Autors wurden stets verneint. Auch eine umfassende Systematik zur begrifflichen Abbildung aller fachlichen Aspekte der Informationswissenschaft konnte nicht gefunden werden.
Um die zur Bewältigung der Aufgabenstellung notwendigen Klassen zu generieren, musste daher auf eine Vielzahl an Hilfsmitteln zurückgegriffen werden. Die Hilfsmittel in Form unterschiedlicher Literatur, Verzeichnisse, Klassifikationen, Fachsystematiken und Informationsschriften dienten zur Extraktion der benötigten Begriffe bzw. ihrer fachlich korrekten Zuordnung zueinander.
Zur systematischen Einteilung der Wissensgebiete und Fachbereiche der FH Darmstadt auf formaler Ebene dienten insbesondere:
• Die Systematik des Regensburger Verbund-Kataloges [RVK 2002]
• Die Systematik Bildungswesen, insbesondere Hochschule des Institutes für Hochschulforschung Wittenberg [HoF 2001]
• Eine Informationsschrift der Kultusministerkonferenz zum deutschen Bildungswesen [Jon 2001]
• Die Fachgebietssystematik der Selbsteintragungsmaske der Datenbank für Online-Ressourcen des Deutschen Bildungsservers [DIPF 2002]
Theoretische Grundlagen und Hilfsmittel 29
• Die aktuellen Vorlesungsverzeichnisse des Fachbereiches Sozial- und Kulturwissenschaften [FHD 2002a]
Für die Bearbeitung des Teils des Wissensnetzes zur inhaltlichen Beschreibung der Lehrveranstaltungen des Fachbereiches Information und Wissensmanagement: Klassifikation, Indexierung und Thesaurus sowie Information Retrieval und deren Materialien sowie der Verwaltung der Lehr-Lernmaterialien der entsprechenden Online-Lehrveranstaltungen dienten folgende Hilfsmittel:
• Die ECTS-Beschreibungen der Lehrveranstaltungen Indexierung und Thesauri sowie Klassifikation [FHD 2002b]
• Die Kapitel: „Klassifikation“, „Thesaurus und Indexieren“, „Klassieren, Extrahieren“ aus: Grundlagen der praktischen Information und Dokumentation [Kno 1997], [Man 1997], [Bur 1997]
• Die aktuelle Prüfungsordnung/Studienordnung des Studiengangs Information und Wissensmanagement der FH Darmstadt [FHD 2002c]
• Das Schlagwortverzeichnis der Webseite Methodik [Kno 2002c]
• Der Zeitschriftenartikel Computeraugen: Inhaltsbasierte Bildsuchmaschinen für Web und PC [Tri 2002]
• Die Klasse: Informationswissenschaft - Grundlage, Theorie des Regensburger Verbund Kataloges 18
• Trex, die Online Klassifikation zum Thema Informationswissenschaft des FB Informationswissenschaft der Universität des Saarlandes [Trex 2000]
• Klassifikation und Thesaurus der Infodata-Datenbank [Inf 1994], [Inf 2001]
• Das Virtuelle Handbuch Informationswissenschaft [Har 2002]
Universitäten orientieren sich allgemein hinsichtlich ihrer Aufbauorganisation und Struktur an der Systematik der in [Jon 2001] als Fachrichtungen und Fächergruppen bezeichneten Einheiten. Die FH Darmstadt weicht diesbezüglich ab. Die Benennung
Theoretische Grundlagen und Hilfsmittel 30
2.3.1 XML
Die eXtensible Markup Language (XML) ist ein Text basiertes Auszeichnungsformat zur Codierung textueller Informationen. In XML sind die Informationen zu Inhalt, Struktur und Layout eines Dokumentes getrennt. Somit ist eine flexible Organisation von Dokumentinhalten und deren Mehrfachverwendung möglich (Print, Internet, CD-ROM auf derselben inhaltlichen Basis). Mittels Auszeichnungen (Tags), die in den Text eingefügt werden, können die Daten eines Dokuments strukturell und semantisch beschrieben werden. Folgendes Quelltextbeispiel zeigt die Struktur einer XML-Datei mit interner DTD. Festgelegt wird innerhalb der Spitzklammern mit der Bezeichnung Doctype, dass es fünf Elemente geben darf, von denen je vier Elemente: „to, from, heading, body“ Zeichenketten, also Text enthalten dürfen. Das Element: „note“ darf keine Zeichenketten enthalten, sondern dient als umfassendes Element (Elternelement) für die vier übrigen Elemente. Im Beispiel übernimmt das Element: „note“ die für jedes XML Dokument obligatorische Funktion des Wurzelelementes: XML-Dokumente haben immer eine Baumstruktur. Die zweite Hälfte des Quelltextes repräsentiert die eigentliche Information. Eingefasst von den Auszeichnungen (Tags): „<note>“ und „</note>“ befinden sich die genannten vier Elemente, die die eigentlichen Informationsfragmente gemäß ihrer Bedeutung umfassen bzw. auszeichnen.
Theoretische Grundlagen und Hilfsmittel 31
<?xml version="1.0"?>
<!DOCTYPE note [
<!ELEMENT note (to,from,heading,body)>
<!ELEMENT to (#PCDATA)>
<!ELEMENT from (#PCDATA)>
<!ELEMENT heading (#PCDATA)>
<!ELEMENT body (#PCDATA)>
]>
<note>
<to>Tove</to>
<from>Jani</from>
<heading>Reminder</heading>
<body>Don't forget me this weekend!</body>
</note>
Quelltext 1: XML-Syntax mit interner DTD
Dem Beispiel fehlen Angaben zur Gestaltung. Diese können in einer eigenen Datei abgelegt werden und müssten dann entsprechend referenziert werden. Die andere Möglichkeit besteht darin, die Definition den Header-Angaben hinzuzufügen. Auf die überaus vielfältigen Möglichkeiten zur Gestaltung mit Hilfe von CSS oder XSL soll im Rahmen dieser Arbeit nicht explizit eingegangen werden. Die Trennung von Struktur, Inhalt und Gestaltung ist sicherlich auch so deutlich zu erkennen.
Die Art der Auszeichnungen und deren zulässige Verschachtelungen werden in einem eigens zu erstellenden Regelwerk, der so genannten Document Type Definition (DTD) festgelegt. Dessen Interpretation und Verarbeitung obliegt dem verarbeitenden Programm. XML als Auszeichnungssprache stellt hinsichtlich ihrer Möglichkeiten eine Teilmenge der Standard Generalized Markup Language (SGML) dar. SGML existiert seit 1986 als internationaler Standard 8879. Aufgrund seiner hohen Komplexität blieb seine Verwendung auf spezielle Anwendungsbereiche beschränkt. Um die potentiellen Möglichkeiten des SGML-Standards für das Internet nutzbar zu machen und es einem größeren Nutzerkreis zugänglich zu machen, wurde XML entwickelt. Es wurde 1998 durch das W3C standardisiert.
Theoretische Grundlagen und Hilfsmittel 32
Soll ein XML-Dokument visuell dargestellt werden, so ist die Festlegung des Layouts mit Hilfe sogenannter Stylesheets (XSL, CSS) notwendig. Durch die Erweiterung mit Xlink und Xpointer 19 , den Definitionen für Dokumentverknüpfungen, kann XML HTML ersetzen und für hypermediale Projekte eingesetzt werden. Durch Programmierung mehrerer verschiedener Stylesheets für eine XML-Datei lassen sich mehrere dem jeweiligen Medium angepasste Darstellungen erzeugen.
Die potentielle Vielfalt der Möglichkeiten lässt maßgeschneiderte Lösungen zu. In der Praxis der letzten Jahre wurden für verschiedene Anwendungsbereiche 20 DTDs entwickelt. Vorteilhaft in diesem Zusammenhang ist, dass jedes Dokumentenformat, sofern es verfügbar ist, sich für eigene Zwecke verwenden lässt und gegebenenfalls modifiziert werden kann.
Theoretische Grundlagen und Hilfsmittel 33
wird basiert auf
definiert durch
Abb 3: Gemeinsamkeiten von DSSSL, XSL, CSS, SGML, XML und HTML
Die Resource Description Framework (RDF) Model and Syntax Specification [W3C 1999] und die RDF Schema Specification 1.0 sind Standards des W3C. Im Fokus der Entwicklung stand das Ziel, Applikationen für das Internet entwickeln zu können. Spezifiziert wurde ein Datenmodell zur Wissensrepräsentation im Sinne einer Darstellung von Eigenschaften und Eigenschaftswerten. RDF bietet z.B. die Möglichkeit, Metadatenverzeichnisse anzulegen und die zugehörigen Informationsobjekte zu referenzieren. Dabei können bereits vorhandene Metadaten verwendet und integriert werden. Als Speicher- und Austauschformat dient XML. RDF-Dokumente müssen keine validen XML-Dokumente sein. Das Datenmodell von RDFbasiert auf den Basiselementen Ressource, Property und Statement.
Theoretische Grundlagen und Hilfsmittel 34
Abb 4: RDF-Statement als gerichteter Graph
Die Aussage des abgebildeten Statements lautet: Thomas Oerder ist Autor des Dokumentes ressource.htm, welches durch den URL http://www.url_der_ressource/ressource.htm repräsentiert wird (und dort zu finden wäre). In XML-Syntax ausgedrückt:
<?xml version="1.0"?>
<rdf:RDF
xmlns:rdf="http://www.w3.org/TR/REC-rdf-syntax#"
- Citar trabajo
- Thomas Oerder (Autor), 2002, Ein semantisches Netz für die virtuelle Hochschule. Konzeption, Entwicklung, Nutzungskonzepte, Múnich, GRIN Verlag, https://www.grin.com/document/185813
-
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X. -
¡Carge sus propios textos! Gane dinero y un iPhone X.