Themenstellung:
Im Rahmen eines Projektes zur Erstellung eines Wissensmanagement – Systems soll eine Export – Schnittstelle von der OpenOffice Writer Komponente in ein vorgegebenes XML – Format realisiert werden. Dabei unterteilt sich die Studienarbeit in zwei Kern - Aufgaben. Zum einen soll die Ausgabedatei des OpenOffice Writer eingehend untersucht werden und zum anderen soll die Export - Funktion implementiert werden.
Inhaltsverzeichnis
- GLOSSAR
- EINLEITUNG
- SINN UND ZWECK
- THEORETISCHE GRUNDLAGEN
- TECHNOLOGIEN (XML)
- XML - Xtensible Markup Language
- DTD Data Type Definition
- Namespaces
- XSL/XSLT - Xtensible Stylesheet Language
- XPath – XML Path Language
- Xlink XML Linking Language
- XPointer - XML Pointing Language
- XSLT - Prozessor
- XMLParser
- FORMATE
- XHTML
- DocBook
- Mydoc (Semantic Web)
- APPLIKATIONEN
- OpenOffice
- Saxparser
- Semantic Webbrowser
- TECHNOLOGIEN (XML)
- KONZEPTION
- 000 DATEIFORMAT - DAS AUSGANGSFORMAT
- Analyse der OpenOffice Writer Datei
- Metadaten (office:meta)
- Einstellungen (office:settings)
- Stilinformationen / Gestaltungselemente (office:styles)
- Inhalt (office:content)
- Office- interne und selbstdefinierte Styles
- Defintion von Internet Links
- Ablage und Aufruf von Bildern
- Analyse der OpenOffice Writer Datei
- XML FORMAT DES SEMANTIC WEBBROWSERS – DAS ZIELFORMAT
- TRANSFORMATION
- Extraktion des Archivs
- Erzeugung einer „flachen“ XML - Datei
- Transformation in das neue XML - Format
- 000 DATEIFORMAT - DAS AUSGANGSFORMAT
- UMSETZUNG
- UMSETZUNG EINES OOO EXPORT – FILTER
- Verlinkung des OpenOffice Applikationskern
- Implementierung einer UNO – basierten OpenOffice API
- Nutzung des XML - basierten Dateiformats
- INTEGRATION IN DEN OPENOFFICE WRITER
- IMPLEMENTIERUNG DES XSLT - STYLESHEET
- Meta und Dokumentinformationen
- Übernahme von Bildinformationen
- Textkörper, Überschriften und besondere Textfelder
- Stil und Farbinformationen
- Die Problematik der gesonderten Stildefinition
- Die Problematik des gesonderten Stilinformation
- Die Problematik der attributbasierten Stilinformation
- JA! - Extraktion und Verknüpfung mittles boolscher XPath – Anweisung
- UMSETZUNG EINES OOO EXPORT – FILTER
- FAZIT
Zielsetzung und Themenschwerpunkte
Die Studienarbeit zielt auf die Implementierung einer Export-Schnittstelle von der OpenOffice Writer Komponente in ein vorgegebenes XML-Format ab. Diese Schnittstelle soll automatisch eine flache XML-Datei generieren, die mit einer vorgegebenen DTD kompatibel ist und alle Meta-, Stil-, Link-Informationen und den Inhalt des Dokuments enthält.
- Analyse der OpenOffice Writer Datei und des XML-Formats des Semantic Webbrowsers
- Entwicklung einer Transformationsstrategie für die Konvertierung von OpenOffice Writer Daten in das Ziel-XML-Format
- Implementierung eines Export-Filters für OpenOffice Writer, der die Transformation der Daten ermöglicht
- Integration des Export-Filters in OpenOffice Writer
- Entwicklung eines XSLT-Stylesheets für die Formatierung der XML-Datei
Zusammenfassung der Kapitel
Das erste Kapitel definiert die grundlegenden technischen Konzepte, die für die Entwicklung der Export-Schnittstelle relevant sind, einschließlich XML, DTD, Namespaces, XSL/XSLT, XPath, Xlink, XPointer, XSLT-Prozessor, XMLParser, XHTML, DocBook und Mydoc. Kapitel 5 beschreibt die Konzeption der Export-Schnittstelle, die die Analyse des OpenOffice Writer Dateiformats, das XML-Format des Semantic Webbrowsers und die Transformationsprozesse umfasst. In Kapitel 6 wird die Implementierung des Export-Filters und des XSLT-Stylesheets erläutert, einschließlich der Integration in OpenOffice Writer und der Problemlösung bei der Stildefinition. Das Kapitel befasst sich auch mit der Verwendung von XPath-Anweisungen zur Extraktion und Verknüpfung von Stilinformationen. Das Fazit in Kapitel 7 fasst die Ergebnisse der Studienarbeit zusammen.
Schlüsselwörter
Die wichtigsten Themen und Konzepte dieser Arbeit sind: OpenOffice Writer, XML-Export, Semantic Webbrowser, DTD, XSLT, XPath, Stylesheets, Metadaten, Stilinformationen, Transformationsstrategie, Integration, OpenOffice API.
Häufig gestellte Fragen
Was ist das Ziel der OpenOffice XML Export-Schnittstelle?
Die Schnittstelle soll Dokumente aus OpenOffice Writer automatisch in ein flaches XML-Format konvertieren, das für Wissensmanagement-Systeme nutzbar ist.
Welche Technologien werden für die Transformation genutzt?
Zum Einsatz kommen XML, XSLT für die Formatierung, XPath zur Datenextraktion sowie die OpenOffice API (UNO).
Wie ist eine OpenOffice Writer Datei aufgebaut?
Sie besteht aus verschiedenen XML-Komponenten für Metadaten (meta), Einstellungen (settings), Stile (styles) und den eigentlichen Inhalt (content).
Welche Probleme treten bei der Stil-Extraktion auf?
Herausforderungen liegen in der Verknüpfung von attributbasierten Stilinformationen und der korrekten Übernahme von Bild- und Textfeldern.
Was ist der Semantic Webbrowser in diesem Kontext?
Es ist das Zielsystem, dessen spezifisches XML-Format (Mydoc) durch den Export-Filter bedient werden soll.
- Quote paper
- Dominik Heinz (Author), 2004, Open Office XML Export, Munich, GRIN Verlag, https://www.grin.com/document/169047