Die Arbeit beginnt mit einem Überblick über bereits im Internet vorhandene Suchmaschinen. Deren Vorteile und insbesondere Nachteile werden aufgezeigt, um einen Vergleich mit dem in dieser Arbeit verwendeten Konzept durchführen zu können. In diesem Zusammenhang wird nicht auf Suchmaschinen im Einzelnen eingegangen, sondern deren grundlegende Konzepte werden erläutert. Darauf wird der Aufbau Semantischer Netze beschrieben, ihre Struktur als Graphen und die Besonderheiten, durch die sie sich von anderen, bereits vorhandenen Konzepten abgrenzen. Nach einer kurzer Beschreibung der Anwendungsgebiete von Semantischen Netzen erläutern Beispiele den Nutzen und die Funktionsweise Semantischer Netze. Dieser Übersichtsdarstellung folgt eine umfassende und detaillierte Darstellung des Konzepts der implementierten Suchmaschine. Die Funktionsweise der zugrundeliegenden Menüs wird aufgezeigt und auch an Beispielen verdeutlicht. Zudem wird darauf hingewiesen, an welchen Stellen das hier verwendete Konzept nicht dem theoretischen Modell entspricht. Im nächsten Kapitel erfolgt eine Beschreibung der Implementierung der LKT-Dokumentensuche. Zunächst wird die Oberfläche beschrieben, und alle Optionen, die dem Benutzer dabei zur Verfügung stehen, werden erklärt. Das darauf folgende Unterkapitel der Arbeit gibt eine Übersicht über die Zusatzprogramme, mit deren Hilfe die Datenbank manipuliert werden kann, z.B. Ändern der Dokumentdaten oder Einfügen eines Dokuments. Danach wird eine Darstellung der Datenbankstrukturen und der Verknüpfungen der Tabellen untereinander gegeben. In den Datenbankstrukturen ist das Grundgerüst des Semantischen Netzes vollständig hinterlegt, während die Suchintelligenz in den php-Skripten liegt. Zusätzlich wird die Funktionsweise des Automatischen Uploads erklärt, der es ermöglicht, Dokumente automatisch in die Datenbank einzutragen. Möglichen Fehlbedienungen wird dadurch vorgegriffen und die Bedienfreundlichkeit für den Benutzer wird erhöht. Die Arbeit schließt mit einem Überblick über die verwendete Software und eine kurze Erläuterung der Quelltexte der einzelnen Programme. Damit sind die Programmstrukturen gemeint. Besondere Bedeutung wird den Seiten schlag.html und schlag2.html beigemessen; ihre Funktionsweisen werden explizit aufgeführt, da sie den Kern der Suche bilden.
Inhaltsverzeichnis
- 1 Einleitung
- 1.1 Motivation der Arbeit
- 1.2 Aufbau der Studienarbeit
- 2 Bekannte Suchmaschinen des Internets
- 2.1 Hierarchiebasierende Suchmaschinen
- 2.2 Suchmaschinen mit Volltextsuche
- 2.3 Metasuchmaschinen
- 3 Semantische Netze
- 3.1 Was sind Semantische Netze?
- 3.2 Anwendungsgebiete von Semantischen Netzen
- 3.3 Beispiele verschiedener möglicher Ausprägungen Semantischer Netze
- 3.3.1 Weiterentwicklung des Internets zu einem Semantischen Netz ([BLHL01])
- 3.3.2 Das Semantische Netz der Dokumentensuche
- 3.4 Zukunftsausblick für Semantische Netze
- 4 Konzept der Dokumentensuche
- 5 Implementierung der Dokumentensuche
- 5.1 Aufbau/Ablauf der Suche
- 5.1.1 Start der Suche
- 5.1.2 Einstieg in die Suche
- 5.1.3 Ergebnisausgabe und Weitersuchen
- 5.1.4 Einordnen eines Dokuments oder Stichworts
- 5.2 Übersicht über die Hilfsprogramme der Suchmaschine
- 5.2.1 Eintragung eines Dokumentes in die Datenbank
- 5.2.2 Überprüfung des Status, Einordnung eines Dokuments
- 5.2.3 Änderung eines Dokumenteintrags
- 5.2.4 Löschung von Dokumenten
- 5.3 Aufbau der Datenbankstruktur und der Tabellen
- 5.3.1 Die Tabelle tbDokument
- 5.3.2 Die Tabelle tbDokAutor
- 5.3.3 Die Tabelle tbStichwort
- 5.3.4 Die Tabelle tbMenuOber
- 5.4 Automatischer Upload
- 5.4.1 Funktionsweise des Uploads
- 5.4.2 Automatische Benachrichtigung per E-Mail
- 6 Erläuterungen zur Programmierung
- 6.1 Übersicht über die verwendete Software
- 6.1.1 Programmiersprache php
- 6.1.2 Das relationale Datenbank Management System MySQL
- 6.2 Einstieg in die Suche: schlag.html
- 6.3 Suchalgorithmus: schlag2.html
- 6.3.1 Die Funktion suchmenu ($stichwort)
- 6.3.2 Die Funktion suche_stichworte ($liste)
- 6.3.3 Die Funktion Menuebeschreibung ($men_id)
- 6.3.4 Die Funktion Beschreibung ($MenID)
- 6.3.5 Die Funktion Abfrage_ende()
- 6.3.6 Die Funktion NeueAnfrage ($MenID, $SwID)
- 6.3.7 Die Funktion Zeige_Menue
- 6.3.8 Die Funktion Unterteile ($gruppe, $total)
- 6.4 Die Seiten einord1.html, dok_ch.htm, delete.htm, multidel.htm
- 6.5 Die Seite dok_ins.htm
Zielsetzung und Themenschwerpunkte
Die Studienarbeit zielt auf die Implementierung einer Dokumentensuche am Lehrstuhl für Konstruktionstechnik/CAD ab, die die wachsende Anzahl an Dokumenten besser handhabbar macht. Die Suche soll benutzerfreundlich sein und ohne detaillierte Kenntnisse des Dokumenteninhalts funktionieren. Ein bestehender Suchalgorithmus wird adaptiert, und die notwendigen Datenbankstrukturen werden erstellt.
- Adaption eines Suchalgorithmus für die Dokumentenverwaltung.
- Erstellung von Datenbankstrukturen für ein semantisches Netz.
- Implementierung einer benutzerfreundlichen Oberfläche für die Dokumentensuche.
- Entwicklung eines automatischen Upload-Systems mit E-Mail-Benachrichtigung.
- Vergleich mit bestehenden Internet-Suchmaschinen.
Zusammenfassung der Kapitel
1 Einleitung: Dieses Kapitel führt in die Thematik ein und beschreibt die Motivation hinter der Entwicklung einer neuen Dokumentensuche. Die bisherige, mangelhafte Organisation der Dokumente am Lehrstuhl führte zu zeitaufwändiger Mehrfacherstellung und erschwertem Zugriff. Die Arbeit konzentriert sich auf die Anpassung eines bestehenden Suchalgorithmus an die spezifischen Bedürfnisse des Lehrstuhls und die Implementierung eines semantischen Netzes zur Verbesserung der Suchfunktion. Besonderes Augenmerk wird auf die Minimierung des Aufwands für die Datenpflege gelegt, was durch einen automatischen Upload mit E-Mail-Benachrichtigung erreicht werden soll. Der Vergleich mit bekannten Internet-Suchmaschinen und deren Vor- und Nachteile bildet den Kontext für das gewählte Konzept.
2 Bekannte Suchmaschinen des Internets: Das Kapitel analysiert die Funktionsweise gängiger Internet-Suchmaschinen. Es werden hierarchiebasierende Suchmaschinen und Suchmaschinen mit Volltextsuche unterschieden und deren Vor- und Nachteile im Detail erläutert. Hierarchiebasierte Suchmaschinen leiden unter eingeschränkter Suchflexibilität und der Gefahr, in falschen Baumzweigen zu enden. Suchmaschinen mit Volltextsuche führen hingegen oft zu einer unübersichtlichen Ergebnismenge. Metasuchmaschinen werden als Kompromiss vorgestellt, die jedoch die Nachteile der zugrundeliegenden Suchmaschinen erben. Diese Analyse dient als Grundlage für die Bewertung des neu entwickelten Suchkonzepts.
3 Semantische Netze: Dieses Kapitel erklärt das grundlegende Konzept semantischer Netze. Semantische Netze werden als Graphen dargestellt, deren Knoten Bedeutungen tragen und deren Kanten Relationen zwischen den Knoten repräsentieren. Im Gegensatz zu herkömmlichen Netzen sind die Relationen in semantischen Netzen informationsreich und geben Auskunft über die Art des Zusammenhangs. Die Universalität des Konzepts und seine Anwendungsmöglichkeiten, insbesondere im Bereich der Informationsverwaltung und -nutzung, werden hervorgehoben. Beispiele, wie die Weiterentwicklung des Internets zu einem semantischen Netz und die Anwendung in der Dokumentensuche, veranschaulichen den Nutzen.
4 Konzept der Dokumentensuche: Dieses Kapitel beschreibt das spezifische Konzept der implementierten Dokumentensuche, welches auf einem semantischen Netz basiert. Die Knoten des Netzes werden durch Begriffe/Stichwörter repräsentiert, denen wiederum Dokumente zugeordnet werden können. „Menüs“ dienen als verbindende Elemente zwischen den Stichwörtern und ermöglichen eine geführte Suche, die den Benutzer durch das Netz zum gesuchten Dokument leitet. Im Gegensatz zu herkömmlichen Suchmaschinen ist die Suche nicht auf den Dokumentennamen beschränkt, sondern berücksichtigt den Kontext, in dem das Dokument erstellt wurde. Das Konzept ermöglicht sowohl eine gezielte Suche nach spezifischen Dokumenten als auch eine thematische Suche.
5 Implementierung der Dokumentensuche: Dieses Kapitel beschreibt detailliert die Implementierung der Dokumentensuche. Die benutzerfreundliche Oberfläche mit Navigationsleiste und Arbeitsfenster wird erläutert. Der Ablauf der Suche, inklusive der Auswahl von Stichwörtern, der Eingabe zusätzlicher Stichwörter, der Filterung nach Dokumentkategorien und der Einstellung des Schärfegrades der Suche, wird Schritt für Schritt erklärt. Die Ausgabe der Suchergebnisse, die Möglichkeit der Präzisierung der Suche und die Funktionen zum Einordnen von Dokumenten und Stichwörtern werden ausführlich beschrieben. Zusätzlich werden die Hilfsprogramme der Suchmaschine, wie das manuelle Eintragen von Dokumenten, die Überprüfung des Datenbankstatus, das Ändern von Dokumentdaten und das Löschen von Dokumenten, vorgestellt.
Schlüsselwörter
Dokumentensuche, Semantisches Netz, Suchalgorithmus, Datenbankstruktur, MySQL, PHP, Benutzeroberfläche, Automatischer Upload, Geführte Suche, Volltextsuche, Hierarchische Suche, Datenbankverwaltung, Web-Agenten, Ontologien.
Häufig gestellte Fragen zur Studienarbeit: Implementierung einer Dokumentensuche
Was ist das Thema der Studienarbeit?
Die Studienarbeit befasst sich mit der Implementierung einer neuen Dokumentensuche am Lehrstuhl für Konstruktionstechnik/CAD. Ziel ist es, die wachsende Anzahl an Dokumenten besser zu verwalten und den Zugriff darauf zu vereinfachen.
Welche Probleme sollen mit der neuen Dokumentensuche gelöst werden?
Die bisherige Organisation der Dokumente war mangelhaft, was zu zeitaufwändiger Mehrfacherstellung und erschwertem Zugriff führte. Die neue Suche soll diese Probleme lösen.
Welche Art von Suchalgorithmus wird verwendet?
Die Arbeit adaptiert einen bestehenden Suchalgorithmus und erweitert ihn um die Funktionalität eines semantischen Netzes zur Verbesserung der Suchergebnisse.
Was ist ein semantisches Netz und wie wird es in der Dokumentensuche eingesetzt?
Ein semantisches Netz ist ein Graph, dessen Knoten Bedeutungen (Begriffe/Stichwörter) und dessen Kanten Relationen zwischen diesen Bedeutungen repräsentieren. In der Dokumentensuche ermöglicht es eine kontextbasierte Suche, die über die reine Volltextsuche hinausgeht.
Welche Datenbank wird verwendet und welche Programmiersprache?
Die Suchmaschine verwendet MySQL als relationales Datenbankmanagementsystem und PHP als Programmiersprache.
Welche Datenbankstrukturen wurden erstellt?
Es wurden Datenbanktabellen (tbDokument, tbDokAutor, tbStichwort, tbMenuOber) erstellt, um die Dokumente, Autoren, Stichwörter und die hierarchische Struktur des semantischen Netzes zu verwalten.
Wie funktioniert die Benutzeroberfläche der Dokumentensuche?
Die Benutzeroberfläche ist benutzerfreundlich gestaltet und bietet eine Navigationsleiste und ein Arbeitsfenster. Die Suche erfolgt über die Auswahl von Stichwörtern, die Möglichkeit zur Eingabe zusätzlicher Stichwörter, Filterung nach Dokumentkategorien und Einstellung des Schärfegrades.
Welche Hilfsprogramme bietet die Suchmaschine?
Die Suchmaschine bietet Hilfsprogramme zum manuellen Eintragen von Dokumenten, zur Überprüfung des Datenbankstatus, zum Ändern von Dokumentdaten und zum Löschen von Dokumenten.
Gibt es einen automatischen Upload?
Ja, die Suchmaschine verfügt über einen automatischen Upload-Mechanismus mit automatischer E-Mail-Benachrichtigung über den Upload-Status.
Wie wird die neue Dokumentensuche mit bestehenden Internet-Suchmaschinen verglichen?
Die Arbeit vergleicht die neue Dokumentensuche mit bekannten Internet-Suchmaschinen (hierarchisch, Volltextsuche, Metasuchmaschinen) und deren Vor- und Nachteile, um das gewählte Konzept zu bewerten.
Welche Schlüsselwörter beschreiben die Studienarbeit am besten?
Dokumentensuche, Semantisches Netz, Suchalgorithmus, Datenbankstruktur, MySQL, PHP, Benutzeroberfläche, Automatischer Upload, Geführte Suche, Volltextsuche, Hierarchische Suche, Datenbankverwaltung, Web-Agenten, Ontologien.
Welche Kapitel umfasst die Studienarbeit?
Die Studienarbeit umfasst Kapitel zu Einleitung, bekannten Internet-Suchmaschinen, semantischen Netzen, dem Konzept der Dokumentensuche, der Implementierung der Dokumentensuche und Erläuterungen zur Programmierung.
- Quote paper
- Dipl.-Ing. Sören Wanke (Author), 2001, Implementierung einer Dokumentensuche basierend auf einem Semantischen Netz, Munich, GRIN Verlag, https://www.grin.com/document/115919