“The idea is to build a library of everything, and the opportunity is to build a great library that offers universal access to all of human knowledge.” Diese Aussage stammt aus einem Interview mit Brewster Kahle aus dem Jahr 2002 und bezieht sich dabei auf die Vision, die hinter dem von ihm ge-gründeten Internet Archive steht. Das Internet Archive ist die größte und wohl bekannteste Initia-tive zur Archivierung von Webseiten weltweit. Und auch wenn die These, das Internet umfasse das ge¬samte menschliche Wissen, zumindest diskutabel ist, zeigt sie doch, welche Bedeutung man den In¬halten des Internets und deren Bewahrung beimessen kann und in welche Richtung dessen Entwicklung gehen könnte.
Als Quasi-Standard zur Toolunterstützung für größere Archivierungsprojekte wird in der Fachliteratur immer wieder auf den Open-Source-Crawler Heritrix in Verbindung mit der Software Wayback verwiesen , welche die spätere Rekonstruktion der Webseiten ermöglicht.
Doch wie hilfreich sind die mit diesen Tools entwickelten Snapshots von Webseiten für konkrete regionale Anwendungsszenarien, die über das Nachempfinden des Look And Feels historischer Seiten hinausgehen? Nicht zuletzt aufgrund mangelnder Qualität der Archivinhalte des Internet Archives zur Domain http://www.stadt.bamberg.de/ hat das Stadtarchiv Bamberg 2009 begonnen, selbst in regelmäßigen Abständen auf konventionellen Weg einen Snapshot vom Internetauftritt der Stadt Bamberg zu erstellen, dessen Qualität zusätzlich durch erhöhten Aufwand mittels manueller Nach¬bearbeitung sichergestellt wird. Zeigt das Beispiel des Internet Archives, dass Tools, die für die Verwendung auf sehr großen Webkollektionen entwickelt wurden, tendenziell eher ungeeignet für kleine Archivierungs¬projekte sind oder bieten sich Heritrix und Wayback auch für das Stadtarchiv Bamberg zur Verwendung an? Ziel der Arbeit ist es, dieser Frage nachzugehen.
Nach einem theoretischen Einstieg in die Methodik der Webarchivierung werden dazu in Kapitel 3 zunächst Architektur und Funktionsumfang von Heritrix und Wayback beleuchtet. Später wird dann ein Snapshot von der Homepage der Stadt Bamberg, welcher vollautomatisch mit Heritrix erstellt wurde, exemplarisch den Snapshots des Stadtarchiv und denen des Internet Archives genübergestellt und hinsichtlich unterschiedlicher Kriterien verglichen. Letztlich sollen die Ergebnisse in einem Fazit bewertet und ein Ausblick auf die weitere Entwicklung von Heritrix und Wayback gegeben werden.
Inhaltsverzeichnis
I Abbildungsverzeichnis
II Tabellenverzeichnis
III Abkürzungsverzeichnis
1 Einleitung
2 Herausforderungen und Methoden der Webarchivierung
2.1 Herausforderungen der Webarchivierung
2.2 Methodikzur Webarchivierung
3 Software-Werkezeuge zur Webarchivierung
3.1 Der Crawler Heritrix
3.1.1 Funktionsweise von Heritrix
3.1.2 Architektur vonHeritrix
3.1.3 Modulare Verwendung von Heritrix
3.2 Das ARC-Dateiformat
3.3 Wayback
3.3.1 Query UI
3.3.2 Resource Store
3.3.3 ResourceIndex
3.3.4 Replay UI
4 Fallbeispiel: Die Homepage der Stadt Bamberg
4.1 Einführung in das Fallbeispiel
4.2 Snapshot des Internet Archive
4.3 Snapshot des Stadtarchivs Bamberg
4.4 Snapshot mit Heritrix und Wayback
4.5 Vergleich der Ergebnisse
5 Fazit und Ausblick
Literaturverzeichnis
- Citation du texte
- Anonyme,, 2011, Methoden der Webarchivierung am Beispiel der Webseite der Stadt Bamberg, Munich, GRIN Verlag, https://www.grin.com/document/169417
-
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X. -
Téléchargez vos propres textes! Gagnez de l'argent et un iPhone X.