In diesem Aufsatz werden der Entwicklungsprozess eines Instruments zur Archivierung und Codierung von Webseiten sowie das entwickelte Instrument selbst vorgestellt. Während der Ausführungen fließen immer wieder Beispiele aus der exemplarisch durchgeführten Archivierung und Codierung ein. Ausgangspunkt für das Projekt, das beim Landeskirchlichen Beauftragten der Evangelisch-Lutherischen Kirche in Bayern für religiöse und geistige Strömungen mit Sitz in Bayreuth (Landeskirchlicher Beauftragter) durchgeführt wurde, war die Überlegung, wie man in der heutigen medial geprägten Wissenschaftswelt erstens sinnvoll, möglichst neutral und objektiv, vergleichend mit Webseiten arbeiten kann. Und wie man zweitens eine momentane Ergebnissicherung der Webseiteninhalte in tabellarischer Form zu Papier bringen kann, um diese auch in Zukunft, falls die Webseiten schon nicht mehr bestehen, schnell nach einzelnen Stichworten durchsuchen zu können.
Inhaltsverzeichnis
1 Einleitung
2 Vorgehensweise bei der Generierung der Methode
2.1 Fragestellung
2.2 Webseitenauswahl
2.3 Auswahl der Computerprogramme
2.4 Codierung
2.4.1 Codierungsmerkmale
2.4.2 Arbeit mit den Codierungsergebnissen
3 Die Methode
3.1 Fragestellung
3.2 Auswahl der Computerprogramme
3.3 Webseitenauswahl und Speicherung
3.4 Codierung
3.4.1 Medium
3.4.2 Kontext und Thema
3.4.3 Kategorie
4 Fazit
1 Einleitung
In diesem Aufsatz werden der Entwicklungsprozess eines Instruments zur Archivierung und Codierung von Webseiten sowie das entwickelte Instrument selbst vorgestellt. Während der Ausführungen fließen immer wieder Beispiele aus der exemplarisch durchgeführten Archivierung und Codierung ein. Ausgangspunkt für das Projekt, das beim Landeskirchlichen Beauftragten der Evangelisch-Lutherischen Kirche in Bayern für religiöse und geistige Strömungen mit Sitz in Bayreuth (Landeskirchlicher Beauftragter) durchgeführt wurde, war die Überlegung, wie man in der heutigen medial geprägten Wissenschaftswelt erstens sinnvoll, möglichst neutral und objektiv, vergleichend mit Webseiten arbeiten kann. Und wie man zweitens eine momentane Ergebnissicherung der Webseiteninhalte in tabellarischer Form zu Papier bringen kann, um diese auch in Zukunft, falls die Webseiten schon nicht mehr bestehen, schnell nach einzelnen Stichworten durchsuchen zu können. Das Projekt wird als erfolgreich gewertet, wenn es sich als realistisch erweist, ca. 20 Webseiten mit je etwa drei (ausgewählten) Unterseiten und einem groben Umfang von jeweils 500 Wörtern (oder analog Bild- und/oder Tondaten in vergleichbarem Umfang) zu einem Thema innerhalb eines Jahres auf einer halben Forschungsassistenzstelle[1] zu archivieren. Ziel des Projektes ist es somit zum einen, bestehende Computerprogramme zu finden, die sich unterstützend auf die Entwicklung einer Methode auswirken, und zum anderen, eben diese Methode herauszuarbeiten. Das Endergebnis, welches durch die Anwendung der Methode generiert wird, soll in strukturierter, tabellarischer Form aus alphabetisch aufgelisteten Codes bestehen, die auf die jeweiligen Webseiten verweisen. Codes bezeichnet dem Ursprungstext entnommene, daher emische Begriffe. Der Ausgangsidee folgend sollen die erstellten Tabellen dazu dienen, zusammen mit den abgespeicherten und teilweise abgedruckten Webseiten die Seiteninhalte vergleichend analysieren und archivieren zu können. Es soll also auf der einen Seite ein Werkzeug zur Erstellung der Arbeitsgrundlage für eine anschließende Analyse, wobei mindestens ein Teil der Analyse Wert auf eine Vergleichbarkeit der Webseiten legt und sich dabei auf die Codes bezieht, erstellt werden. Auf der anderen Seite dient das Instrument der systematischen Archivierung der Webseiten. Da die Arbeit beim Landeskirchlichen Beauftragten entstanden ist, wurde mit dem Thema Magie ein inhaltlich spannendes Thema ausgewählt.
In Hinblick auf das Endergebnis waren zwei Dinge wichtig: Erstens soll eine ökonomische, ressourcensparende Methode sowohl bezüglich der Arbeitszeit als auch der finanziellen Investition entstehen. Zweitens ist die rechtliche Absicherung wichtig. Um die Urheberrechte der Webseitenbetreiber zu wahren, können die Ergebnisse nicht in aller Vollständigkeit veröffentlicht werden. Jedoch sollen für das eigene Archiv zu jedem bearbeiteten Themenfeld fünf Exemplare angefertigt werden.
Im zweiten Kapitel wird zunächst die Vorgehensweise bei der Generierung der Methode dargestellt. Hierbei stehen die Hintergrundüberlegungen, die Durchführung, aber auch die aufgetretenen Probleme zur Diskussion. Weiterhin enthält das Kapitel grobe Zeitangaben für die einzelnen Arbeitsschritte und, anhand von konkreten Beispielen aus der vorliegenden Arbeit, Hilfestellungen zur leichteren Bearbeitung der Webseiten. Die Beispiele beziehen sich auf unsere exemplarische Archivierung von Anfangs 23 Unterseiten der Webseite www.weisse-magie.de. Die Unterkapitel behandeln nacheinander die Schwerpunkte Fragestellung, Webseitenauswahl, Auswahl der Computerprogramme und die Codierung.
Das darauffolgende Kapitel enthält eine Ergebnissicherung, gewissermaßen die Zusammenfassung und Reflexion der Methodengenerierung – Die Methode. Inhaltlich geht es auch hier um die folgenden chronologisch abzuarbeitenden Teilschritte: Fragestellung, Auswahl der Computerprogramme, Webseitenauswahl und deren Speicherung sowie die Codierung. Letztere lässt sich grob in die vier Bereiche Codes, Medium, Kontext und Thema sowie Kategorie unterteilen.
Den Schluss bildet ein kurzes Fazit.
2 Vorgehensweise bei der Generierung der Methode
Den Anfang nahm das Projekt im Mai 2012. Zunächst stand die Frage nach einer Methode im Raum, mit welcher es möglich ist, Webseiten sinnvoll zu archivieren und deren Inhalte in tabellarischer Form zu Papier zu bringen. Nach einer Sichtung des Forschungsstandes und einer relativ erfolglosen Recherche in vorhandenen Methoden entstand die Idee, selbst eine Methode zu generieren und dabei exemplarisch das Thema Magie zu bearbeiten. Gegen Ende des Pilotprojektes wurden wir auf die Langzeitarchivierung „nestor“[2] aufmerksam gemacht. Bisher fand weder eine intensive Auseinandersetzung noch eine Kontaktaufnahme statt.
In der folgenden Zeit widmeten wir uns der Webseitenauswahl und Abspeicherung, parallel wurde nach geeigneten Programmen gesucht, um Anfang Juni 2012 mit der Codierung der Webseiten zu beginnen. Im Anschluss an Überlegungen zur Fragestellung sollen die eben benannten Arbeitsschritte, unter Berücksichtigung der aufgetretenen Probleme, beschrieben werden.
2.1 Fragestellung
Da der Hauptfokus dieses Projektes auf der Herausarbeitung der Methode lag, wurde zunächst von einer konkreten Fragestellung an das Material, also an die Webseiten, abgesehen. Dies erwies sich im weiteren Verlauf der Arbeit als äußerst problematisch, da dem Ausmaß der Codierung keine inhaltlichen Grenzen gesetzt waren. Zum Ende der Arbeit wurde die Frage an das Material dahingehend konkretisiert, dass Webseiten mit den Kontexten (zur Bedeutung von Kontexten siehe Kapitel 2.4.1 ) „Ritualablauf“ und „magische Theoriebildung“ in das Endergebnis aufgenommen wurden, die übrigen Seiten wurden verworfen.
2.2 Webseitenauswahl
Die finale Auswahl der zu untersuchenden Seiten erfolgte letzten Endes, durch den exemplarischen Charakter der Arbeit bedingt, relativ willkürlich. Zunächst sollten etwa zwanzig möglichst heterogene Seiten archiviert werden. Die Heterogenität sollte sowohl an den verwendeten Medien (Text, Ton, Bild), der potentiellen Zielgruppe, den verhandelten Themenbereichen und den Kontexten (Ritualanleitung, Hintergrundinformationen zu Magie, Zaubersprüche etc.) festgemacht werden. Da für eine solche Auswahl selbst schon eine grobe Analyse der gefundenen Seiten stattfinden muss, begannen Speicherung und Codierung letztlich bei einer beliebig gewählten Webseite. An dieser Stelle sei angemerkt, dass sich eine gewisse Willkür durch die gesamte Arbeit hindurch zieht. Es gab immer wieder Entscheidungspunkte, an denen zunächst keine Kriterien angesetzt werden konnten, ohne dabei einen unverhältnismäßig hohen Aufwand in Kauf zu nehmen, da die Ergebnisse selbst das Ziel der Studie sein sollten.
2.3 Auswahl der Computerprogramme
Parallel zur Webseitensuche mussten zu Beginn des Projektes geeignete Computerprogramme gefunden werden, mit denen sich die Webseiten abspeichern lassen, die Codes tabellarisch notieren lassen und ein Tagebuch als Hilfestellung für das Verfassen dieses Berichtes geschrieben werden kann. Dabei war unerheblich, ob es sich um ein einzelnes Programm handelt oder um mehrere verschiedene Programme. Wichtig war für uns, dass es sich um Freeware Programme handelt, damit die Methode in gewisser Weise reproduzierbar ist und damit keine unnötigen finanziellen Ressourcen investiert werden, falls sich die Methode als unpraktikabel erweisen sollte. Für die Abspeicherung der Webseiten wurde das Programm Local Website Archive in der LITE-Version (LWA) verwendet. Im Laufe des Projektes erwies es sich leider in mehrerlei Hinsicht als suboptimal. Innerhalb des Programms lassen sich unterschiedliche Archive anlegen. Zum Beispiel das Magie Archiv, das Kochrezepte Archiv und das Hauptarchiv. Innerhalb eines Archivs werden die jeweiligen Unterseiten in selbst angelegten Ordnern abgespeichert. Bei einer Übertragung der Daten auf ein anderes Endgerät können die einzelnen Archive (inklusive ihrer Ordnerstruktur) lediglich in das neue Hauptarchiv übernommen werden. Das heißt, wenn Magie-Seiten ursprünglich getrennt von Kochanleitungen in einem eigenen Archiv waren, so sind sie hinterher zwar noch getrennt voneinander durch die Ordner, aber beide im Hauptarchiv. Ein größerer Nachteil liegt darin, dass die archivierten Webseiten nicht bearbeitet werden können. Es wäre hilfreich, wenn in den Text (den Medien) Markierungen und Kommentare eingefügt werden könnten, um die Codierung zu vereinfachen (mehr dazu später). Vorteile des Programms sind die Suchfunktion und die Notizen, die man einer abgespeicherten Seite hinzufügen kann. Für dieses Projekt sind sie allerdings weniger essentiell. Eine sinnvolle Alternative findet sich möglicherweise darin, die Webseiten im PDF-Format abzuspeichern (über firefox, PDF Creator oder alternative PDF Druckersoftware) und dann mit Hilfe eines PDF Bearbeitungsprogramms (z.B. nitro PDF Reader) zu codieren. Möglicherweise gibt es auch gute Programme, mit denen man die Seiten sowohl Speichern (PDF Druck) als auch bearbeiten kann. Ein Nachteil im Vergleich zu LWA liegt darin, dass die gespeicherten Webseiten komplett manuell archiviert werden müssen. Dies lässt sich aber mit Hilfe systematisch angelegter Dateiordner bewältigen.
[...]
[1] Eine halbe Forschungsassistenzstelle wird hier mit 8 Stunden in der Woche berechnet.
Häufig gestellte Fragen
Worum geht es in diesem Dokument?
Dieses Dokument beschreibt den Entwicklungsprozess eines Instruments zur Archivierung und Codierung von Webseiten, sowie das entwickelte Instrument selbst. Es enthält Beispiele aus einer exemplarischen Archivierung und Codierung, die im Rahmen eines Projekts beim Landeskirchlichen Beauftragten der Evangelisch-Lutherischen Kirche in Bayern durchgeführt wurde.
Was war das Ziel des Projekts?
Das Ziel des Projekts war es, eine Methode zu entwickeln, um Webseiten sinnvoll, neutral und objektiv zu archivieren und ihre Inhalte in tabellarischer Form darzustellen, um sie auch in Zukunft, bei Nichtexistenz der Webseiten, schnell nach Stichworten durchsuchen zu können. Ein weiteres Ziel war es, Computerprogramme zu finden, die die Entwicklung dieser Methode unterstützen.
Welche Aspekte waren bei der Entwicklung der Methode wichtig?
Zwei Hauptaspekte waren wichtig: Erstens, eine ökonomische und ressourcensparende Methode in Bezug auf Arbeitszeit und finanzielle Investition zu entwickeln. Zweitens, die rechtliche Absicherung zu gewährleisten, um die Urheberrechte der Webseitenbetreiber zu wahren.
Wie war die Vorgehensweise bei der Generierung der Methode?
Die Vorgehensweise umfasste die folgenden Schritte: Fragestellung, Webseitenauswahl, Auswahl von Computerprogrammen und die Codierung der Webseiten. Im Laufe des Projekts traten Probleme auf, die im Dokument diskutiert werden.
Welche Programme wurden zur Archivierung und Codierung der Webseiten verwendet?
Für die Abspeicherung der Webseiten wurde das Programm Local Website Archive (LWA) in der LITE-Version verwendet. Es wurden jedoch auch Alternativen wie das Speichern von Webseiten im PDF-Format und die Verwendung von PDF-Bearbeitungsprogrammen in Betracht gezogen.
Welche Probleme traten bei der Codierung auf?
Ein Problem war, dass zunächst keine konkrete Fragestellung an das Material gestellt wurde, was zu einem unbegrenzten Umfang der Codierung führte. Später wurde die Fragestellung dahingehend konkretisiert, dass Webseiten mit den Kontexten „Ritualablauf“ und „magische Theoriebildung“ in das Endergebnis aufgenommen wurden.
Was bedeutet "Codierung" in diesem Zusammenhang?
Codierung bezieht sich auf die Extraktion von relevanten Begriffen und Informationen aus den Webseiten und deren systematische Erfassung in einer Tabelle. Die Codierung umfasst die Bereiche Medium, Kontext und Thema sowie Kategorie.
Was ist das Endergebnis der Methode?
Das Endergebnis ist eine strukturierte, tabellarische Form von Codes, die auf die jeweiligen Webseiten verweisen. Diese Tabellen sollen zusammen mit den abgespeicherten Webseiten die Seiteninhalte vergleichend analysieren und archivieren können.
Warum wurde das Thema Magie als Beispiel gewählt?
Das Thema Magie wurde gewählt, da die Arbeit beim Landeskirchlichen Beauftragten entstanden ist und es ein inhaltlich spannendes Thema darstellt.
Was ist nestor?
nestor ist ein Projekt zur Langzeitarchivierung, auf das im Laufe des Pilotprojekts aufmerksam gemacht wurde. Es fand jedoch bisher keine intensive Auseinandersetzung oder Kontaktaufnahme statt.
- Quote paper
- Nahrin Lahdo (Author), 2013, Codierung und Archivierung von Webseiten, Munich, GRIN Verlag, https://www.grin.com/document/214751