XML - der Internet-Standard zur elektronischen Datenübertragung und seine betriebswirtschaftliche Bedeutung im E-Commerce


Mémoire (de fin d'études), 2001

124 Pages, Note: 2


Extrait


image b1d274467390f9a55d9eb86407301983

I. Inhaltsverzeichnis ____________________________________________________________________________

I. Inhaltsverzeichnis

III. Abbildungsverzeichnis

IV. Tabellenverzeichnis

V. Gliederung

VI. XML - der Internet-Standard zur elektronischen Daten- und seine betriebswirtschaftliche Bedeutung im E-Commerce

VII. Literaturverzeichnis

VIII. Danksagung

IX. Eidesstattliche Erklärung

II. Abkürzungsverzeichnis ____________________________________________________________________________

II. Abkürzungsverzeichnis

C2C = Consumer to Consumer CAD = Computer Added Design CERN = European Organization for Nuclear Research CMS = Content-Management-System CSS = Cascading Style Sheets

E = Electronic EDI = Electronic Data Interchange EDIFACT = Electronic Data Interchange For Administration, Commerce and Transport EDV = Elektronische Datenverarbeitung ERP = Enterprise Resource Planning

HTML = Hypertext Markup Language

II. Abkürzungsverzeichnis ____________________________________________________________________________

IT = Information Technology

PDA = Personal Digital Assistent

TDCC = Transportation Data Coordinating Commitee

VAN = Value Added Network

XLL = Extensible Linking Language XML = Extensible Markup Language XSL = Extensible Stylesheet Language

IV. Tabellenverzeichnis ____________________________________________________________________________

IV. Tabellenverzeichnis

Tabelle 2 23 Überblick über wichtige Schlüsselwörter und Indikatoren einer DTD

Tabelle 3 47 Charakteristische Unterschiede zwischen B2B und B2C

Tabelle 4 68 Ausgangslagen für Internet/EDI-Systeme

VI. XML - der Internet-Standard zur elektronischen Datenübertragung und seine 1

betriebswirtschaftliche Bedeutung im E-Commerce

____________________________________________________________________

1. Einleitung

Das Internet befindet sich in einem enormen Wachstum. Unternehmen stehen heute unabhängig von ihrer Größe im Internet im Wettbewerb. Mitbewerber sind nur noch wenige Mausklicks von einander entfernt, wodurch sich viele monopolistisch geprägte Märkte in hart umkämpfte virtuelle Märkte verwandelt haben.

Wurde das Internet vor ein paar Jahren noch hauptsächlich dazu genutzt, Webseiten von Firmen oder Privatleuten zu betrachten, entwickeln sich heute ungeahnte Potentiale im Internet. Die Webseiten wurden dynamisch, das heißt, sie reagieren auf Eingaben des Benutzers. Daraus entwickelten sich z.B. Online-Banking und ganze Shop-Systeme, die jetzt endlich den dem Internet eigentlich angedachten Zweck erfüllen, nämlich eine elektronische Datenübermittlung zur Reduktion von Zeit und Kosten. Darüber hinaus geht seit einiger Zeit der Trend bei den Unternehmen dahin, nicht nur den Verkauf ihrer Produkte über das Internet zu betreiben, sondern auch weitere Geschäftsbereiche, wie z.B. den Einkauf oder die Lohn- und Gehaltsabrechnung, auf das Internet zu verlagern.

VI. XML - der Internet-Standard zur elektronischen Datenübertragung und seine

Zwei Begriffe stehen im Titel der Arbeit im Vordergrund: XML und E- Während E-Commerce heute in aller Munde ist und durch die weiterentwickelten Möglichkeiten des Internet von einer breiten Öffentlichkeit wahrgenommen und genutzt wird, sorgt die Extensible Markup Language

(XML) eher in IT-Fachkreisen 1 für Aufsehen.

Ziel vorliegender Arbeit ist es, herauszustellen, welche Potentiale XML im E-Business besitzt und wo die Einsatzmöglichkeiten für die XML-Technologie liegen.

Im ersten Teil wird XML von der strukturellen und technischen Seite erläutert. Der Aufbau wird durch ein einleitendes Beispiel dargestellt. Ebenso ist die

Abgrenzung von XML zu HTML 2 und SGML 3 Bestandteil der technischen Erläuterung. Verwandte Sprachen und die Problematik der Erweiterbarkeit von XML bilden den Schluß des ersten Abschnitts.

Der zweite Teil beleuchtet intensiv die betriebswirtschaftliche Bedeutung von XML. Zunächst werden einige wichtige Begriffe definiert. Darauf folgt eine Betrachtung von EDI 4 und EDIFACT 5 . Im Anschluß daran wird die Bedeutung von XML im konkreten Beispiel E-Procurement in Verbindung mit BMEcat 6 dargestellt.

Den Schluß bildet eine kritische Diskussion der Lösungsansätze zur Problemstellung der Arbeit.

VI. XML - der Internet-Standard zur elektronischen Datenübertragung und seine 3

betriebswirtschaftliche Bedeutung im E-Commerce

____________________________________________________________________

Zunächst einmal, wofür stehen diese drei Buchstaben? 7 Extensible = With XML you create the tags you need für your documents. Markup = With XML you identify, or markup, elements within your document. Language = With XML, you follow a set of rules and syntax to markup your document.

Zu Beginn ein kleines Beispiel, um die Methodik von XML zu erläutern: 8 Was haben XML und der eigene Kontostand auf einem Kontoauszug gemeinsam? Bei näherer Betrachtung einiges. Der Kontostand enthält ein Feld mit der Überschrift Kontostand und darin befindet sich entweder eine positive oder eine negative Zahl. Der Mensch ist intuitiv dazu in der Lage, diese Zahl als entweder ein Guthaben oder eine Schuld zu interpretieren. Das Gehirn ist darauf geschult worden. Computer hingegen sind in dieser Beziehung ‚dumm‘. Sie besitzen eine derartige Auffassungsgabe nicht. Um dem Computer diese Zahl verständlich zu machen und die damit auszuführenden Operationen, muß ihm explizit die Struktur des Ausdrucks und die Bedeutung der einzelnen Felder und Überschriften beigebracht werden. Nur wenn ihm alle Informationen exakt wie gelernt vorliegen, kann der Rechner die Daten weiterverarbeiten.

Genau dies ist die zentrale Aufgabe von XML: die Beschreibung von Informationen. Man bezeichnet XML daher auch als Meta-Sprache, die anwendungsbezogen die inhaltliche Struktur von Daten beliebiger Natur beschreibt.

VI. XML - der Internet-Standard zur elektronischen Datenübertragung und seine 4

betriebswirtschaftliche Bedeutung im E-Commerce

____________________________________________________________________

XML-Transaktionen in das interne Format konvertiert werden. Dies beschleunigt in nicht unerheblichem Maße die Geschäftstransaktionen. Dazu aber später mehr im Kapitel 8 (EDI).

XML ist also eine Beschreibungssprache, die es ermöglicht, durch ihre Erweiterbarkeit neue Tags zu definieren, mit denen dann der jeweilige Geschäftsvorgang exakt abgebildet werden kann. Unter Tags versteht man die Teile des Dokuments, die den Inhalt umrahmen, also die Strukturbeschreibung. Beispiel: <artikelnr>340986312</artikelnr> Hier ist die Nummer „340986312“ der Inhalt und <artikelnr> der Anfangs-Tag und </artikelnr> der Schluß-Tag.

VI. XML - der Internet-Standard zur elektronischen Datenübertragung und seine 5

betriebswirtschaftliche Bedeutung im E-Commerce

____________________________________________________________________

XML ist vom Prinzip her keine völlig neue Programmiersprache. Sie wurde vielmehr aus SGML entwickelt. XML ist somit ein SGML-Ableger, der speziell auf die Anforderungen der Webtechnologie zugeschnitten wurde. Warum aber der Umweg über XML, wenn es SGML schon lange gibt? SGML wurde in den 70er und 80er Jahren entwickelt und ist auch seitdem in zuverlässigem Einsatz. Allerdings besitzt SGML einen derart komplexen Aufbau, daß der Aufwand der Programmierung oder überhaupt des Erlernens der Sprache unverhältnismäßig hoch ist. SGML wird heute nur noch in einigen Spezialbereichen wie zum Austausch komplexer chemischer Formeln oder komplizierter Geschäftsvorgänge verwendet. Die Sprache geht aber weit über das hinaus, was das Internet erfordert. Deshalb

entschied sich das W3C 10 , SGML „abzuspecken“ und daraus XML zu entwickeln.

XML ist wie SGML eine Metasprache, mit deren Hilfe sich eigene Dokumentbeschreibungssprachen entwickeln lassen. XML liefert die Regeln und Definitionen für diese anderen Sprachen.

VI. XML - der Internet-Standard zur elektronischen Datenübertragung und seine 6

betriebswirtschaftliche Bedeutung im E-Commerce

____________________________________________________________________

image cf548e88071675a66d09af83563dc29b
Entwickelt von Tim Berners-Lee im CERN 12 zu 1989 HTML Genf

image b644be6cdf0ef45d13e6dfac1ad099be
1996 HTML 3.2 Über eine Version 3.0 konnte keine Einigung erzielt werden, deshalb 3.2 als Kompromiß 1996 XML 1.0 Standard wird als Diskussionsvorschlag veröffentlicht 1997 HTML 4.0 Im Dezember des Jahres als Standard vom W3C verabschiedet

image be3efaeaa599b2daf7fce3953724faf6
1998 XSL 1.0 Im August des Jahres zur Diskussion gestellt

image 6382303aee2bf8e91232e09c344e3a2e
2001 XML Schema 2. Mai: Das W3C gibt XML Schema als Recommendation 13 frei

Tabelle 1: Geschichte der Markup-Sprachen Eigene Darstellung in Anlehnung an http://amor.rz.hu-berlin.de/ , 12.06.2001

In späteren Abschnitten der Arbeit wird auf einige der genannten Sprachen noch näher eingegangen werden. Deshalb soll die kurze Übersicht an dieser Stelle genügen.

VI. XML - der Internet-Standard zur elektronischen Datenübertragung und seine 7

betriebswirtschaftliche Bedeutung im E-Commerce

____________________________________________________________________

image 7b8549f4f644905c47ba5828e7e60e61

Abbildung 1: Beziehungen der Metasprachen Eigene Darstellung

Das W3C hat sich zur Festlegung international verbindlicher Standards in Sachen Datenübermittlung und Strukturbedingungen etabliert. Gegründet

wurde es im Oktober 1994 am MIT 15 Laboratory for Computer Science (MIT/LCS) in Boston (USA). Durch die Globalisierung wurde es notwendig, Außenstellen an zentralen Punkten der Welt zu eröffnen. Im April 1995 wurde

die erste Niederlassung des W3C außerhalb Amerikas beim INRIA 16 eingerichtet, der französischen Schwesterorganisation der GMD 17 . Im August 1996 folgte eine weitere Niederlassung in Tokio (Japan) an der Keio

VI. XML - der Internet-Standard zur elektronischen Datenübertragung und seine 8

betriebswirtschaftliche Bedeutung im E-Commerce

____________________________________________________________________

ausgearbeitet.

Anschließend wird er als Public Working Draft der Öffentlichkeit zur

Verfügung gestellt.

Wurden die Kritiken und Fehler des Working Drafts beseitigt, erlangt das

Papier den Status einer Candidate Recommendation, also einer „angehenden Empfehlung“.

Danach erhält die Candidate Recommendation den Titel einer Proposed

Recommendation, was einer „vorgeschlagenen Empfehlung“ entspricht.

Mit Verabschiedung zur W3C Recommendation ist die Stufe eines

VI. XML - der Internet-Standard zur elektronischen Datenübertragung und seine 9

betriebswirtschaftliche Bedeutung im E-Commerce

____________________________________________________________________

Programmierlegende Brian Kernighan stellte einmal fest, daß das Problem mit ‚What You See Is What You Get‘ folgendes ist 18 : das was man sieht, ist alles was man bekommt. Hier liegt der grundlegende Unterschied zwischen HTML und XML bzw. SGML.

Die Markup-Language HTML definiert, wie der Name schon sagt, in welchem Layout Text oder Grafik auf dem Bildschirm ausgegeben wird. Allerdings ist es für HTML aufgrund des begrenzten Vorrats an Tags nicht möglich, den Inhalt zu beschreiben und zu qualifizieren.

Dies verdeutlicht folgendes Beispiel: 19 <p><b>Mrs. Mary McGoon</b>

<br>1401 Main Street <br>Anytown, NC 34829</p>

Auch wer sich nicht mit HTML auskennt, sollte intuitiv feststellen können, daß es sich bei dem Beispiel um eine (amerikanische) Postanschrift handelt.

Um nun zum Beispiel die Postleitzahl durch eine Abfrage aus dieser Adresse herauszufiltern, müßte eine Formulierung in etwa wie diese geschrieben werden: „Gegeben ist ein <p>-Tag, der zwei <br>-Tags enthält. In diesem <p>-Tag ist vor dem Komma der Name der Stadt, die zwei Buchstaben dahinter bilden die Staatenkennung und die fünf Zahlen zum Schluß die Postleitzahl.“

VI. XML - der Internet-Standard zur elektronischen Datenübertragung und seine 10

betriebswirtschaftliche Bedeutung im E-Commerce

____________________________________________________________________

Auch hier wird jeder schnell erkennen, daß es sich bei dem Beispiel um eine Postanschrift handelt. Es ist wahrscheinlich sogar einfacher, da bei den einzelnen Tags explizit angegeben ist, um was es sich bei dem Inhalt handelt. XML ist also für den Menschen angenehmer lesbar als HTML. Die Ausgabe

des Dokuments ist abhängig von der dazugehörigen Stylesheet-Datei 20 und der DTD 21 bzw. XML Schema 22 .

Doch nicht nur die Lesbarkeit wurde verbessert. Auch die Abfrage nach der Postleitzahl ist in XML erheblich einfacher und genereller als in HTML. Die

VI. XML - der Internet-Standard zur elektronischen Datenübertragung und seine 11

betriebswirtschaftliche Bedeutung im E-Commerce

____________________________________________________________________

noch einmal gänzlich umgeschrieben werden. Hier zeigt sich der Vorteil der

Plattformunabhängigkeit von XML 25 . Der Text wird einmal in einem XML- erfaßt. Die Anpassung an die verschiedenen Betriebssysteme,

Applikationen oder ERP-Systeme 26 wird dann nur noch in der Stylesheet- oder XSL-Datei 27 vorgenommen. Dies hat den Vorteil, daß die XML-Datei unverändert bleibt und somit Fehlerquellen bei der Übersetzung vermieden werden.

- HTML ist eine SGML-Anwendung. Es besitzt nur begrenzte Auszeichnungsmöglichkeiten durch eine fixe Anzahl von Tags. Eines der größten Probleme bei HTML ist die zum Teil erheblich abweichende Interpretation und Darstellung von Tags in unterschiedlichen Browsern (wie Microsoft Internet Explorer, Netscape Navigator oder Opera).

VI. XML - der Internet-Standard zur elektronischen Datenübertragung und seine 12

betriebswirtschaftliche Bedeutung im E-Commerce

____________________________________________________________________

VI. XML - der Internet-Standard zur elektronischen Datenübertragung und seine 13

betriebswirtschaftliche Bedeutung im E-Commerce

____________________________________________________________________

3. Die Extensible Markup Language (XML)

3.1 Das Sprachkonzept

In den folgenden Abschnitten wird auf die einzelnen Elemente eines XML- anhand eines Beispiels erklärend eingegangen. Deshalb an dieser Stelle nur eine Abbildung zur Übersicht über das Sprachkonzept:

image 0ac79945baeeb4785fd12990227bffa6

Abbildung 2: Das Sprachkonzept von XML Eigene Darstellung in Anlehnung an http://www.heindl.de/ , 06.06.2001

VI. XML - der Internet-Standard zur elektronischen Datenübertragung und seine 14

betriebswirtschaftliche Bedeutung im E-Commerce

____________________________________________________________________

bezeichnet, wenn ihm keine DTD oder sonstigen strukturbestimmenden Eigenschaften zugeteilt sind, aber trotzdem aus dem Dokument eine einwandfreie Baum-Struktur erstellt werden kann, das heißt wenn jedes Anfangs-Tag auch ein entsprechendes End-Tag an der richtigen Stelle besitzt.

Gültigkeit: Ein XML-Dokument ist gültig, wenn es den Anforderungen

einer zugehörigen DTD entspricht. Das heißt, ein gültiges XML-Dokument ist immer auch wohlgeformt. Im Umkehrschluß kann ein Dokument niemals gültig und nicht wohlgeformt sein. Dies veranschaulicht nachfolgende Abbildung:

image 83c97a25e7f011d5f939aaa759945aae

Abbildung 3: Wohlgeformt und gültig bei XML-Dokumenten Eigene Darstellung in Anlehnung an McGrath 1998: 118

VI. XML - der Internet-Standard zur elektronischen Datenübertragung und seine 15

betriebswirtschaftliche Bedeutung im E-Commerce

____________________________________________________________________

produkt.xml: 29

<?xml version="1.0" encoding="UTF-8" standalone="no"?> <!DOCTYPE produkt SYSTEM "produkt.dtd"> <produkte> <posten> <name>Sprechpuppe</name> <nr>32945-39</nr> <hersteller> <firma>Spielemüller</firma> <ort>Lauterbauch</ort> </hersteller> <preis waehrung="DM">80</preis> <preis waehrung="Euro">40</preis> </posten> <posten> <name>Holz-Kasper</name> <nr>32945-40</nr> <hersteller> <firma>Spielemüller</firma> <ort>Lauterbauch</ort> </hersteller> <preis waehrung="DM">30</preis> <preis waehrung="Euro">15</preis> </posten> </produkte>

Der oben stehende Quellcode ist ein typisches Beispiel für eine XML-Datei zur Verwaltung von Produkten. Wie schon erwähnt, fällt es dem Menschen nicht schwer, aus dieser Textstruktur eine Reihe von Informationen herauszuziehen. Einige Zeilen sind allerdings ohne Erklärung schlecht oder gar nicht zu verstehen. Hauptsächlich handelt es sich dabei nicht um den eigentlichen Informationsteil des Dokuments, der nach dem ersten Inhalt-Tag, dem sog. Wurzelelement, folgt (in unserem Beispiel <produkte>), sondern um die Tags, die das Dokument und den Inhaltsteil bezüglich der Struktur und der Eigenschaften beschreiben. Diese werden im Folgenden schrittweise erklärt.

VI. XML - der Internet-Standard zur elektronischen Datenübertragung und seine 16

betriebswirtschaftliche Bedeutung im E-Commerce

____________________________________________________________________

Der Teil eines XML-Dokuments, der vor dem Start-Tag des ersten Elements (dem Wurzelelement) erscheint, wird als Prolog bezeichnet. In unserem Beispiel:

<?xml version="1.0" encoding="UTF-8" standalone="no"?> <!DOCTYPE produkte SYSTEM "produkte.dtd">

3.3.1.1 Deklaration

Im Prolog steht die Deklaration des XML- bzw. SGML-Typs.

Darin ist angegeben, daß sich vorliegendes Dokument um ein XML-Dokument handelt und es in der Version 1.0 (xml version="1.0") geschrieben ist.

Der Ausdruck encoding="UTF-8" gibt an, welche Zeichenkodierung

verwendet wurde. Hier ist es der Unicode-Zeichensatz. In Europa ist allerdings eher der Zeichensatz iso-8859-1 (Latin-1) gebräuchlich.

standalone="no" ist die Anzeige dafür, daß das Dokument sich bezüglich

der Element-Struktur auf eine externe DTD bzw. XML Schema bezieht. Dagegen teilt eine Standalone-Deklaration, die den Wert „yes“ liefert, dem Parser 31 mit, daß es nicht nötig ist, außerhalb des Dokuments nach einer DTD-Untermenge zu suchen, da alle benötigten Informationen innerhalb des XML-Dokuments eingebunden sind.

VI. XML - der Internet-Standard zur elektronischen Datenübertragung und seine 17

betriebswirtschaftliche Bedeutung im E-Commerce

____________________________________________________________________

<!DOCTYPE produkte SYSTEM "produkte.dtd">

Die DTD stellt die Anforderungen an die Struktur und die verwendeten Elemente bereit. Anhand dieser DTD überprüft die Software (z.B. der Browser), ob das Dokument gültig und somit auch gleichzeitig wohlgeformt ist. 32

Die Definitionen können am Anfang von einer Dokumenten-Instanz erscheinen. In diesem Fall handelt es sich um eine interne DTD. Eine Dokumenttyp-Definition kann aber auch in einer separaten Datei untergebracht werden; man spricht dann von einer externen DTD. Hinter DOCTYPE folgt hier der Name des Wurzelelements der Datei. Mit SYSTEM "produkte.dtd" wird die jeweilige DTD an das Dokument gebunden. Die Datei kann auch auf eine absolut externe DTD, d.h. eine DTD die nicht auf dem eigenen System liegt, verweisen. Dies würde dann in etwa so aussehen: <!DOCTYPE produkte SYSTEM "http://www.oddly.de/produkte.dtd">

3.3.1.3 Schema

Das XML Schema ist eine neue Möglichkeit anstelle von DTDs, XML- zu validieren, das heißt, sie auf ihre Gültigkeit hin zu prüfen. Das XML Schema ist als de-facto-Standard vom W3C verabschiedet worden, um eine einheitliche Richtlinie bezüglich der Struktur von XML-Dokumenten zu bieten.

Das Thema XML Schema verglichen mit DTD wird in Gliederungspunkt 3.7 noch ausführlich behandelt.

VI. XML - der Internet-Standard zur elektronischen Datenübertragung und seine 18

betriebswirtschaftliche Bedeutung im E-Commerce

____________________________________________________________________

Aus dem letzten Abschnitt ging hervor, daß der Prolog den Beginn eines XML- darstellt. Die Instanz aber als Schluß zu bezeichnen, ist nicht ganz richtig. Als Instanz wird nämlich das komplette XML-Dokument bezeichnet. Hier sind sämtliche Informationen gespeichert, die bei der Datenübermittlung von Relevanz sind, also die eigentlichen Produktdaten und die Angaben, wie das Dokument zu interpretieren ist.

Einer DTD können also mehrere Instanzen zugeordnet sein, dem gegenüber kann eine Instanz ebenso durch mehrere DTDs referenziert sein. Näheres dazu unter Gliederungspunkt 3.6 über Namespaces.

3.4.1 Case Sensivity

Die XML-Spezifikation legt fest, daß der Parser den Unterschied zwischen großen und kleinen Buchstaben beachten muß. Als Konsequenz daraus ergibt sich, daß es keine Flexibilität bei der Schreibung der Schlüsselwörter gibt. Sie müssen immer in Großbuchstaben erscheinen. Es muß also <!DOCTYPE und <!ELEMENT und <!ATTLIST und <!NOTATION geschrieben werden, um die Vorgabe der Spezifikation zu erfüllen. Dasselbe gilt für Schlüsselwörter wie SYSTEM und PUBLIC, ebenso wie für die Schlüsselwörter, die in

Attribut 34 -Deklarationen auftreten (ID, CDATA und andere) . Die Groß- und Kleinschreibung muß aber auch bei der Schreibweise der Tags beachtet werden. Die Schreibweise <Produkt>...</produkt> würde eine Fehlermeldung erzeugen, da der Parser hierbei von zwei unterschiedlichen nicht vollständigen Tags ausgeht.

VI. XML - der Internet-Standard zur elektronischen Datenübertragung und seine 19

betriebswirtschaftliche Bedeutung im E-Commerce

____________________________________________________________________

Unter dem Oberbegriff Leerraum werden in XML Leerzeichen, Tabulator- Zeilenende-Markierungen und Leerzeilen zusammengefaßt. Allgemein gilt in XML die Regel, daß Leerraum bewahrt werden muß. Auch wenn es sich um Leerraum handelt, der lediglich in den Quellcode des XML-Dokuments eingefügt wurde, damit ein menschlicher Betrachter sich besser darin orientieren kann, wird dieser Leerraum an die Anwendung weitergegeben.

Das bedeutet, daß Leerzeichen oder sonstige zum Leerraum zugehörige Zeichen immer genau so übergeben werden, wie der Programmierer den Quellcode erstellt hat. Dies hat einen besonderen Vorteil im Hinblick auf die Lesbarkeit und Übersichtlichkeit der Baumstruktur des Quellcodes. Zusätzlich gibt es noch ein spezielles Attribut, das besonders darauf hinweist, daß Leerraum erhalten bleiben soll. Dieses Attribut kann dann einem Element zugeordnet werden. Da dies aber in XML ohnehin die Regel ist, kann das Setzen dieses Attributs höchstens für die verarbeitende Anwendung interessant sein.

Kommentare dienen in XML ebenso wie in HTML oder jeder anderen Programmiersprache dazu, den Code oder einzelne Abschnitte davon zu erklären und damit lesbarer zu machen. Der Anwender bekommt durch die Kommentare eine Vorstellung davon, um was es sich zum Beispiel bei einer bestimmten Unter-Funktion oder Deklaration handelt. Wie in HTML werden Kommentare folgendermaßen in den Quellcode implementiert: <!--Dies ist ein Kommentar.-->

VI. XML - der Internet-Standard zur elektronischen Datenübertragung und seine 20

betriebswirtschaftliche Bedeutung im E-Commerce

____________________________________________________________________

Wie im Gliederungspunkt 3.3.1.2 angedeutet, liefert eine DTD die Anforderungen an die Struktur einer XML-Datei. Zur genaueren Beschreibung der DTD dienen die Befehle Element, Attribut und Entity, welche in den nächsten Punkten erklärt werden. Eine DTD kann entweder intern oder extern an die Datei gebunden werden. Auf welche Weise dies geschieht, hat für die Deklaration der DTD-Elemente keinen Einfluß. In Abbildung 2 sind in der linken Spalte unter DTD die erlaubten Beschreibungsbefehle aufgelistet. Die dem Beispiel aus 3.2 zugeordnete Document Type Definition würde wie folgt aussehen: (Hanke 2001: 71)

<!ELEMENT produkte (posten+)> <!ELEMENT posten (name,nr,hersteller,preis+)> <!ELEMENT name (#PCDATA)> <!ELEMENT nr (#PCDATA)> <!ELEMENT hersteller (firma,ort?)> <!ELEMENT firma (#PCDATA)> <!ELEMENT ort (#PCDATA)> <!ELEMENT preis (#PCDATA)> <!ATTLIST preis waehrung (DM|Euro) #REQUIRED>

3.5.1 Element 35

VI. XML - der Internet-Standard zur elektronischen Datenübertragung und seine 21

betriebswirtschaftliche Bedeutung im E-Commerce

____________________________________________________________________

• Als Zeichen sind nur erlaubt Buchstaben, . (Punkt), - (Minus) und _

(Unterstrich).

Der Name darf nicht mit „xml“ beginnen.

Manchmal ist es sinnvoll, das allgemeine Element weiter zu spezialisieren. Dazu besteht die Möglichkeit, dem Element Attribute zuzuordnen, die angeben, welche Optionen beim Element-Tag gesetzt werden können oder müssen.

Die Syntax zur Definition von Attributen in der DTD ist <!ATTLIST. Dabei werden die Optionen in Klammern gesetzt und mit einem | getrennt. Die allgemeine Formulierung der Attribute gestaltet sich somit wie folgt: <!ATTLIST Tagname Attributname (Attributwert 1|Attributwert

2|...) Option>

Zusatz „Option“ angegeben. Dabei gibt es zwei Möglichkeiten:

#REQUIRED = hierbei ist es zwingend notwendig, das Attribut bei dem

entsprechenden Tag zu setzten, ansonsten erfolgt eine Fehlermeldung

#IMPLIED = gibt an, daß das Attribut im Tag gesetzt werden kann, es aber

nicht zwingend notwendig ist. Bei Weglassen des Attributes würde keine Fehlermeldung folgen.

VI. XML - der Internet-Standard zur elektronischen Datenübertragung und seine 22

betriebswirtschaftliche Bedeutung im E-Commerce

____________________________________________________________________

3.5.3 Entity 38

Auch bei der Entity gibt es einige syntaktische Regeln:

Der Entityname kann bestehen aus Buchstaben, Zahlen und dem

Unterstrich. Dies kann alles miteinander kombiniert werden.

Es darf allerdings am Anfang des Namens keine Zahl stehen, sonst folgt

eine Fehlermeldung.

VI. XML - der Internet-Standard zur elektronischen Datenübertragung und seine 23

betriebswirtschaftliche Bedeutung im E-Commerce

____________________________________________________________________

image 1bcf0c8016b1dc3a380e71e5c079a83e

Symbol Erklärung ( ) Gruppiert Untertags, enthält Attributwerte und Schlüsselwörter , Genaue Anordnung der Elemente in vorgegebener Reihenfolge | Anordnung egal ohne Element muß einmal vorhanden sein + Element muß ein- oder mehrmals vorhanden sein ? Element kann, muß aber nicht vorhanden sein, es ist optional, darf aber nur einmal verwendet werden * Element kann, muß aber nicht vorhanden sein, es kann beliebig oft verwendet werden #PCDATA Parsed Character Data; Element kann beliebige Zeichenfolgen enthalten

Tabelle 2: Überblick über wichtige Schlüsselwörter und Indikatoren einer DTD Eigene Darstellung in Anlehnung an Hanke 2001: 74

Durch Namespaces, zu deutsch „Namensräume“, können Elemente von mehr als einer DTD im gleichen XML-Dokument verwendet werden. Ohne diese Möglichkeit ergibt sich folgendes Zuordnungsproblem in XML: Wenn man ein Dokument gestalten will, das Teile von einem oder mehreren anderen Dokumenten verwendet, kann es passieren, daß andere Autoren die selben Tags verwenden wie im eigenen Dokument. Bei Zusammenführung beider Dokumente ergibt sich dann eine Doppeldeutigkeit des Tags. Beispielsweise ist im eigenen Dokument mit dem Tag <preis> der Kaufpreis einer Ware gemeint und im fremden Dokument der Preis eines Gewinnspiels. Es ist ersichtlich, daß daraus ein gewisses Problem entsteht.

VI. XML - der Internet-Standard zur elektronischen Datenübertragung und seine 24

betriebswirtschaftliche Bedeutung im E-Commerce

____________________________________________________________________

Wenn nun der eigene Tag <preis> im Kontext verwendet wird, sieht die Darstellung wie folgt aus: <preis>19,95</preis>

Im Gegensatz dazu ist die Schreibweise für das fremde Tag: <shop:preis>Kaffeemaschine</preis>

Namespaces ermöglichen also das Zusammenwirken verschiedener XML- in einem Dokument. Sie beseitigen etwaige Namenskonflikte auf Tag-Ebene. Dies geschieht wie erläutert durch die Ergänzung der Tagnamen um einen eindeutigen Schlüsselanteil.

VI. XML - der Internet-Standard zur elektronischen Datenübertragung und seine 25

betriebswirtschaftliche Bedeutung im E-Commerce

____________________________________________________________________

Nach einer nun über zwei Jahre dauernden Entwicklungs- und Testphase hat das W3C XML Schema am 02. Mai 2001 als W3C Recommendation freigegeben. 42 Dies stellt einen entscheidenden Beitrag für die volle Entwicklung von XML dar, da XML Schema im Vergleich zur DTD weitreichende Vorteile bietet. Nachfolgende Abschnitte weisen in XML Schema ein, erläutern den Aufbau und verdeutlichen die Unterschiede zu DTD sowie die Vorteile von XML Schema.

3.7.1 Erläuterung

XML Schema ist wie die DTD ein Ansatz zur Definition von Dokumenttypen und dient somit der Spezifikation von XML-Sprachen. XML Schema wurde so konzipiert, daß es quasi eine Obermenge der DTD-Sprache darstellt. Mit XML Schema läßt sich jede DTD beschreiben. XML Schema ist komplett in XML geschrieben und hat nicht wie die DTD eigene Befehle, die XML erst verständlich gemacht werden müssen. Es stellt also somit ein eigenständiges XML-Dokument dar. Dadurch läßt es sich selbst auch durch ein Schema oder eine DTD beschreiben.

Ebenso wie eine DTD beinhaltet XML Schema Regeln, mit denen ein XML-Dokument auf seine Gültigkeit überprüft werden kann, die sogenannte Validierung.

Die Notwendigkeit für die Entwicklung von XML Schema bestand darin, daß sich mit der starken Verbreitung von XML in der Praxis zunehmend die Grenzen und Nachteile der DTD bemerkbar machten.

VI. XML - der Internet-Standard zur elektronischen Datenübertragung und seine 26

betriebswirtschaftliche Bedeutung im E-Commerce

____________________________________________________________________

Vergleich XML Schema - DTD: 47 ! DTDs haben eine eigene (nicht XML-konforme) Syntax: Um DTDs zu programmieren, muß eine fast eigenständige Sprache erlernt werden. Dies ist kurzfristig mit einem höheren Aufwand und somit mit höheren Kosten verbunden.

XML Schema ist XML:

XML Schema besteht aus den selben Elementen wie ein normales XML- Aus diesem Grund kann sowohl eine DTD zur Beschreibung von XML Schema sowie auch ein selbstbeschreibendes XML Schema existieren. Eine Dokumenten-Instanz (XML-Dokument), welches gegen

VI. XML - der Internet-Standard zur elektronischen Datenübertragung und seine 27

betriebswirtschaftliche Bedeutung im E-Commerce

____________________________________________________________________

! DTDs unterstützen keine Namensräume: 48 Kommt es zu dem Fall, daß die Beschreibungsregeln eines XML-Dokuments aus mehreren DTDs bestehen, so läßt sich die Mehrfachnennung von Elementen nicht absolut ausschließen. Tritt eine solche Mehrfachnennung auf, führt das zu einer Verletzung der Bedingungen über die Wohlgeformtheit von XML-Dokumenten.

XML Schema unterstützt Namensräume:

Wie bei XML-Dokumenteninstanzen lassen sich auch bei XML Schema eindeutige Element-Referenzierungen mittels der Namensräume herstellen. Eine Mehrfachnennung ist dann nicht mehr möglich. Elemente mit gleichem Namen werden in der selben Dokumenteninstanz durch die Beschreibung des Namensraumes getrennt.

DTDs unterstützen weitestgehend dokument-orientierte Datentypen. Damit sind sie nicht flexibel genug, um heutige Aufgaben des E-Commerce zu bewerkstelligen. Denn außer einiger weniger Stringtypen (für Text) und Aufzählungen ist keine Möglichkeit gegeben, Daten hinreichend zu beschreiben. Auch das Definieren eigener Datentypen ist nicht möglich. Vor allem im E-Commerce werden aber Datentypen wie z.B. number, date oder currency benötigt. Es stellt somit eine starke Einengung der Flexibilität von XML dar, wenn DTDs verwendet werden. Auch die

VI. XML - der Internet-Standard zur elektronischen Datenübertragung und seine 28

betriebswirtschaftliche Bedeutung im E-Commerce

____________________________________________________________________

einfachen Datentypen:

Die Anzahl der Datentypen wurde in XML Schema stark vergrößert. Das steigert die Flexibilität bei der Beschreibung von Daten enorm. Auch kann nun explizit ein Wertebereich angegeben werden. XML Schema wurde auf Erweiterbarkeit entwickelt, das heißt, aus den ‚einfachen‘ Basistypen lassen sich weitere komplexere Datentypen konstruieren. Die Definition neuer Datentypen speziell auf die Bedürfnisse abgestimmt, bringt einen erheblichen Performancegewinn bei der Validierung und Verarbeitung der Dokumenteninstanz. Dies wird als Vererbung bezeichnet.

Die Erweiterungsmöglichkeiten von DTDs lassen sich im Wesentlichen reduzieren auf einfache Makro-Funktionalität (über Parameter-Entities). Eine systematische und von außen nachvollziehbare Modularisierung und somit Automatisierung läßt sich damit nur schwer durchführen.

XML Schema erlaubt ausdrückliches Gruppieren von Attributen:

Werden in der Dokumenteninstanz Attribute häufig verknüpft verwendet (z.B. HTML: width + hight), so können diese einmalig zu einer Attributgruppe definiert werden. Diese kann dann in der Instanz anstelle der Aufzählung der einzelnen Attribute eingesetzt werden.

Fin de l'extrait de 124 pages

Résumé des informations

Titre
XML - der Internet-Standard zur elektronischen Datenübertragung und seine betriebswirtschaftliche Bedeutung im E-Commerce
Université
Kiel University of Applied Sciences
Note
2
Auteur
Année
2001
Pages
124
N° de catalogue
V185674
ISBN (ebook)
9783656981749
ISBN (Livre)
9783867464277
Taille d'un fichier
1045 KB
Langue
allemand
Mots clés
internet-standard, datenübertragung, bedeutung, e-commerce
Citation du texte
Stefan Pfänder (Auteur), 2001, XML - der Internet-Standard zur elektronischen Datenübertragung und seine betriebswirtschaftliche Bedeutung im E-Commerce, Munich, GRIN Verlag, https://www.grin.com/document/185674

Commentaires

  • Pas encore de commentaires.
Lire l'ebook
Titre: XML - der Internet-Standard zur elektronischen Datenübertragung und seine betriebswirtschaftliche Bedeutung im E-Commerce



Télécharger textes

Votre devoir / mémoire:

- Publication en tant qu'eBook et livre
- Honoraires élevés sur les ventes
- Pour vous complètement gratuit - avec ISBN
- Cela dure que 5 minutes
- Chaque œuvre trouve des lecteurs

Devenir un auteur