Themenstellung:
Im Rahmen eines Projektes zur Erstellung eines Wissensmanagement – Systems soll eine Export – Schnittstelle von der OpenOffice Writer Komponente in ein vorgegebenes XML – Format realisiert werden. Dabei unterteilt sich die Studienarbeit in zwei Kern - Aufgaben. Zum einen soll die Ausgabedatei des OpenOffice Writer eingehend untersucht werden und zum anderen soll die Export - Funktion implementiert werden.
Inhaltsverzeichnis
- GLOSSAR
- EINLEITUNG
- SINN UND ZWECK
- THEORETISCHE GRUNDLAGEN
- TECHNOLOGIEN (XML)
- XML - Xtensible Markup Language
- DTD Data Type Definition
- Namespaces
- XSL/XSLT - Xtensible Stylesheet Language
- XPath – XML Path Language
- Xlink XML Linking Language
- XPointer - XML Pointing Language
- XSLT - Prozessor
- XMLParser
- FORMATE
- XHTML
- DocBook
- Mydoc (Semantic Web)
- APPLIKATIONEN
- OpenOffice
- Saxparser
- Semantic Webbrowser
- TECHNOLOGIEN (XML)
- KONZEPTION
- 000 DATEIFORMAT - DAS AUSGANGSFORMAT
- Analyse der OpenOffice Writer Datei
- Metadaten (office:meta)
- Einstellungen (office:settings)
- Stilinformationen / Gestaltungselemente (office:styles)
- Inhalt (office:content)
- Office- interne und selbstdefinierte Styles
- Defintion von Internet Links
- Ablage und Aufruf von Bildern
- Analyse der OpenOffice Writer Datei
- XML FORMAT DES SEMANTIC WEBBROWSERS – DAS ZIELFORMAT
- TRANSFORMATION
- Extraktion des Archivs
- Erzeugung einer „flachen“ XML - Datei
- Transformation in das neue XML - Format
- 000 DATEIFORMAT - DAS AUSGANGSFORMAT
- UMSETZUNG
- UMSETZUNG EINES OOO EXPORT – FILTER
- Verlinkung des OpenOffice Applikationskern
- Implementierung einer UNO – basierten OpenOffice API
- Nutzung des XML - basierten Dateiformats
- INTEGRATION IN DEN OPENOFFICE WRITER
- IMPLEMENTIERUNG DES XSLT - STYLESHEET
- Meta und Dokumentinformationen
- Übernahme von Bildinformationen
- Textkörper, Überschriften und besondere Textfelder
- Stil und Farbinformationen
- Die Problematik der gesonderten Stildefinition
- Die Problematik des gesonderten Stilinformation
- Die Problematik der attributbasierten Stilinformation
- JA! - Extraktion und Verknüpfung mittles boolscher XPath – Anweisung
- UMSETZUNG EINES OOO EXPORT – FILTER
- FAZIT
Zielsetzung und Themenschwerpunkte
Die Studienarbeit zielt auf die Implementierung einer Export-Schnittstelle von der OpenOffice Writer Komponente in ein vorgegebenes XML-Format ab. Diese Schnittstelle soll automatisch eine flache XML-Datei generieren, die mit einer vorgegebenen DTD kompatibel ist und alle Meta-, Stil-, Link-Informationen und den Inhalt des Dokuments enthält.
- Analyse der OpenOffice Writer Datei und des XML-Formats des Semantic Webbrowsers
- Entwicklung einer Transformationsstrategie für die Konvertierung von OpenOffice Writer Daten in das Ziel-XML-Format
- Implementierung eines Export-Filters für OpenOffice Writer, der die Transformation der Daten ermöglicht
- Integration des Export-Filters in OpenOffice Writer
- Entwicklung eines XSLT-Stylesheets für die Formatierung der XML-Datei
Zusammenfassung der Kapitel
Das erste Kapitel definiert die grundlegenden technischen Konzepte, die für die Entwicklung der Export-Schnittstelle relevant sind, einschließlich XML, DTD, Namespaces, XSL/XSLT, XPath, Xlink, XPointer, XSLT-Prozessor, XMLParser, XHTML, DocBook und Mydoc. Kapitel 5 beschreibt die Konzeption der Export-Schnittstelle, die die Analyse des OpenOffice Writer Dateiformats, das XML-Format des Semantic Webbrowsers und die Transformationsprozesse umfasst. In Kapitel 6 wird die Implementierung des Export-Filters und des XSLT-Stylesheets erläutert, einschließlich der Integration in OpenOffice Writer und der Problemlösung bei der Stildefinition. Das Kapitel befasst sich auch mit der Verwendung von XPath-Anweisungen zur Extraktion und Verknüpfung von Stilinformationen. Das Fazit in Kapitel 7 fasst die Ergebnisse der Studienarbeit zusammen.
Schlüsselwörter
Die wichtigsten Themen und Konzepte dieser Arbeit sind: OpenOffice Writer, XML-Export, Semantic Webbrowser, DTD, XSLT, XPath, Stylesheets, Metadaten, Stilinformationen, Transformationsstrategie, Integration, OpenOffice API.
- Quote paper
- Dominik Heinz (Author), 2004, Open Office XML Export, Munich, GRIN Verlag, https://www.grin.com/document/169047