Heute ist die Nutzung von Internet Suchmaschinen und Datenbanken zur Recherche praktisch unumgänglich, bieten Sie doch die Möglichkeit Information oft kostenlos zu erschließen. Mit kostenlosen Angeboten ist allerdings nur die eigentliche Information gemeint, die Zeit die zur Recherche aufgewendet wird ist hier noch nicht eingerechnet.
Genau an diesem Punkt unterscheidet sich die professionelle von der zufälligen Recherche, denn es gilt zu differenzieren zwischen dem banalen stöbern und der gezielten Suche nach Information. Dazu ist es wichtig die unterschiedlichen Formen von Retrievalsystemen kennen zu lernen und deren Aufbau nachzuvollziehen. Beleuchtet werden außerdem die zu erwartenden Probleme und Vorzüge sowie die Grenzen der professionellen Internet Recherche. Um die Theorie in die Praxis zu übertragen, wird im letzten Abschnitt dieser Hausarbeit ein onlinebasiertes Retrievalsystem vorgestellt und exemplarisch eine Suche durchgeführt.
Inhaltsverzeichnis
1 Einleitung
2 Grundlagen
2.1 Das HTML Format
2.2 Informationsangebot im WWW
2.3 Suchtechniken
3 Retrievalsysteme
3.1 Aufgaben von Retrievalsystemen im WWW
3.2 Arten von Retrievalsystemen
4 Vor- und Nachteile der WWW Recherche
5 Patentrecherche beim DPMA
Quellenverzeichnis
1 Einleitung
Seit der Erfindung von Datenträgern beschäftigt sich der Mensch mit der Frage des Archivierens beziehungsweise des Auffindens der archivierten Daten.
Mit der Einführung des World Wide Web hat sich die Problematik potenziert.
Täglich fallen unüberschaubare Mengen an Daten alleine in diesem Medium an. Gezielt Informationen in diesem Daten Chaos zu finden erscheint praktisch aussichtslos. In der Pionierzeit des WWW reichte hier eine schlichte Indexdatei im HTML Format um z.B. den Inhalt einer Internetseite abzubilden.
Heute ist die Nutzung von Internet Suchmaschinen und Datenbanken zur Recherche praktisch unumgänglich, bieten Sie doch die Möglichkeit Information oft kostenlos zu erschließen. Mit kostenlosen Angeboten ist allerdings nur die eigentliche Information gemeint, die Zeit die zur Recherche aufgewendet wird ist hier noch nicht eingerechnet.
Genau an diesem Punkt unterscheidet sich die professionelle von der zufälligen Recherche, denn es gilt zu differenzieren zwischen dem banalen stöbern und der gezielten Suche nach Information. Stöbern im Internet, sprich browsen ist ein für fast jeden zugängliches Freizeitvergnügen geworden. Unter browsen versteht man das ungezielte herumsurfen ohne oder nur mit einem unklaren Ziel.
Um klare Ergebnisse zu bekommen und professionell zu recherchieren, benötigt man im WWW geeignete Techniken zur Informationsauffindung.
Für einen effektiven Umgang mit Suchmaschinen des WWW ist es nötig ihre Arbeitsweise zu verstehen beziehungsweise ihre Retrievalsprache gezielt einzusetzen. Dazu ist es wichtig die unterschiedlichen Formen von Retrievalsystemen kennen zu lernen und deren Aufbau nachzuvollziehen.
Beleuchtet werden außerdem die zu erwartenden Probleme und Vorzüge sowie die Grenzen der professionellen Internet Recherche.
Um die Theorie in die Praxis zu übertragen, wird im letzten Abschnitt dieser Hausarbeit ein onlinebasiertes Retrievalsystem vorgestellt und exemplarisch eine Suche durchgeführt.
2 Grundlagen
2.1 Das HTML Format
Das Internet besteht zum Großteil aus Dokumenten deren Inhalt meist textbasiert ist. Um diese Dokumente inhaltlich zu beschreiben, wurde der HTML (Hyper Text Markup Language) Standard eingeführt. Ähnlich einer Programmiersprache wird auch bei HTML mit Befehlen gearbeitet, das heißt mit Hilfe der so genannten tags, die das komplette Layout eines Dokuments in einer logischen Struktur beschreiben.
In das HTML Dokument können verschiedene Arten von Medien eingebunden werden, angefangen bei Text und Grafiken bis hin zum Videofilm und Ton.
Um HTML Dokumente im Internet auffinden zu können, müssen diese lokalisiert werden.
Die URL (Uniform Resource Locator) bietet ein weltweit standardisiertes Format zur Auffindung von Dokumenten durch die Verwendung einer eindeutigen Adresse.
Als Bindeglied zwischen HTML und URL agiert das HTTP (Hypertext Transfer Protokoll), das für die Übertragung der angeforderten Daten sorgt. Im Hinblick auf ein retrievalfähiges Dokument müssen wir die tags einer HTML Datei genau betrachten.
Zwischen diesen tags stehen die für das Retrievalsystem relevanten Informationen.
Der tag <TITLE> gibt z.B. eine sichtbare Beschreibung des HTML Dokuments, <META> hingegen ist primär unsichtbar.
Wichtig sind auch die Links eines Dokuments, welche die Verknüpfung mit weiteren Dokumenten oder vom Dokument unabhängigen externen Quellen anzeigen.
Ein Link wird in HTML als <A> (Anchor) beschrieben.
Je nach Art des eingesetzten Retrievalsystems wird dieses zwischen unterschiedlichen tags nach den gewünschten Informationen suchen.
2.2 Informationsangebot im WWW
Das Informationsangebot im Internet ist so facettenreich wie die Gesellschaft, in der wir leben. Kann doch jeder Information zugänglich machen und verbreiten.
Die Aktualisierung der Daten im Internet ist enorm, daher gilt es diese immer auf ihre Aktualität bzw. auf die Verlässlichkeit der Quelle hin zu prüfen.
Folgende Übersicht bietet eine Segmentierung in einzelne Bereiche sowie die dort angebotenen und abfragbaren Informationen.
Abbildung in dieser Leseprobe nicht enthalten
Abb. 1 Quelle : Regionalzentrum für E-Commerce
Grob lassen sich diese einzelnen Kategorien in 2 Klassen einteilen: zum einen in die der flüchtigen Information und zum anderen in Fakteninformation beziehungsweise Wissenschaftliche Ausarbeitungen.
Zu Ersteren zählen alle Informationen die aus einem kurzfristigen Kommunikationsprozess heraus entstanden sind, wie z.B. Diskussionsbeitrage in einem Forum. Wissenschaftlich relevante Information finden wir dagegen nur in den Bereichen der Universitäten, Forschungseinrichtungen, der Archive und Bibliotheken sowie der Organisationen.
Über die Relevanz und die Wichtigkeit der angebotenen Informationen muss jeder selbst entscheiden.
Generell ist allerdings zu sagen, dass nicht flüchtige Information einen höheren Nutzungswert besitzt und somit auch als Grundlage für weiterführende Recherchen genutzt werden kann.
Der Wahrheitsgehalt ist hier bedeutend höher einzustufen als bei temporärer Information.
An dieser Stelle bieten spezialisierte Retrievalsysteme eine vorselektierte Auswahl an Information an. Diese sind dann Thematisch geordnet und bieten meist auch eine eigene Retrievalsprache zum Auffinden von Information. Seriöse Dienste haben ein zumeist geprüftes Archiv dessen Inhalt meist der Wahrheit entspricht. Allerdings sind solche Dienstleister meist kostenpflichtig.
2.3 Suchtechniken
Geeignete Suchtechniken sind unabdingbar, um für die Recherche annehmbare Ergebnisse zu erzielen. Durch die Unsumme an indexierten Dokumenten die verschiedene Retrievalsysteme bieten kommt man nur dann zu einem geeigneten Ergebnis, wenn man dieses geeignet umschreiben, also mit einer Sprache beschreiben kann.
Jedes Retrievalsystem hat seine eigene Retrievalsprache, die unter anderem über die Qualität sowie die Genauigkeit entscheidet.
Je umfangreicher die Sprache ist, desto genauer wird die Suche.
Über den angebotenen Umfang geben im Allgemeinen die Hilfefunktionen der jeweiligen Suchmaschine Auskunft.
Auf einige der wichtigsten und von den meisten gängigen Suchmaschinen unterstützten Retrievalbefehle wollen wir nun näher eingehen.
Durch die Verwendung solcher Operatoren bzw. unter Berücksichtigung einiger Regeln lassen sich Zeit und Kosten bei der Recherche einsparen.
Umlaute und Sonderzeichen
Suchmaschinen im WWW interpretieren Umlaute unterschiedlich.
Während einige Umlaute erkennen und korrekt interpretieren, wandeln andere Sonderzeichen in Standardzeichen um. Ein Beispiel wäre hier etwa die Umwandlung von „ü“ in „ue“ oder u.
Akzentzeichen werden ebenfalls richtig interpretiert oder in den zugehörigen Buchstaben ohne Akzent umgewandelt.
Den Umgang der Suchmaschine mit Sonderzeichen kann man entweder in deren Hilfeoption einsehen oder durch Test Suchanfragen herausfinden. Andere Sonderzeichen, wie etwa der Bindestrich, sind meist nicht zulässig, da sie oft Bestandteil der Retrievalsprache sind.
Trunkierungen
Suchanfragen mit nicht bekanntem Wortende oder Anfang kann man mit Hilfe der Trunkierung, also einem bloßen Fragment des Wortes suchen. Hierbei werden entweder der Wortanfang oder das Wortende durch eine Trunkierung ersetzt.
Häufig verwendete Zeichen dafür sind etwa * oder das Fragezeichen.
Gibt man als Suchanfrage etwa das Wort „blue*“ ein, so erhält man alle Worte deren Anfang mit „blue“ beginnt wie etwa „bluesky“ und „bluejeans“.
[...]
- Arbeit zitieren
- Jan Kiefer (Autor:in), 2005, Suchdienste im WWW Formen und Eignung für die Recherche, München, GRIN Verlag, https://www.grin.com/document/35485
-
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen.