In dieser Hausarbeit möchte ich aufzeigen, was unter dem Begriff Data Warehouse und Data Warehouse-System zu verstehen ist, wie eine mögliche Architektur aussehen kann, welche Vorteile ein integriertes Data Warehouse-System bietet, welche Lösungen bisher bekannt sind und wie sich das Data Warehouse in der Fachabteilung CTG3 (Wirtschaftlichkeit und Rechnungswesen) der Robert Bosch Elektronik GmbH in Salzgitter als entscheidungsunterstützendes Hilfsmittel anbietet.
Zentrale Begrifflichkeiten der vorliegenden Arbeit sind in der Literatur und im allgemeinen Sprachgebrauch häufig mit den unterschiedlichsten Bedeutungen belegt. Um Missverständnisse und Fehlinterpretationen zu vermeiden, werden die Begriffe Data Warehouse, System und Data Warehouse-System im Detail berücksichtigt. Im folgenden werde ich den Begriff Data Warehouse mit DWH abkürzen.
Inhaltsverzeichnis
1. Einleitung
2. Data Warehouse-System
2.1. Definition Data Warehouse
2.2. Definition System
2.3. Definition Data Warehouse-System
3. Architektur eines Data Warehouse-Systems
3.2. Betrieb
3.3. Metadaten (-management)
3.4. Entwicklung/Weiterentwicklung
3.5. Management
4. Das SAP Business Information Warehouse (BW)
5. Schlusswort/Ausblick und Gründe für ein Data Warehouse
6. Literatur- und Quellenverzeichnis
7. Erklärung zur Haus-/Diplomarbeit gemäß § 26 Abs. 6 DiplPrüfO
Abbildungsverzeichnis
Abbildung 1: Data Warehouse-System
Abbildung 2: ETL-Prozess
Abbildung 3: Architektur des SAP Business Information Warehouse
Abbildung 4: CO-PA Wertfeldschema
Abbildung 5: Verdichtungsbericht ‚KKBC_HOE’
Abkürzungsverzeichnis
Abbildung in dieser Leseprobe nicht enthalten
1. Einleitung
Unter Terabytes von Datenmüll vergraben, verstreut über verschiedene Systeme eines Unternehmens vergammeln wertvolle Informationen.
Der Produktmanager ist verzweifelt. In zwei Tagen muss er seinen Chefs die Absatzentwicklung des von ihm betreuten Fruchtquarks präsentieren. Doch ihm fehlen die Zahlen der letzten sechs Monate! Aus dem Vertrieb hat er nur vage gehört, dass der Umsatz im Osten eingebrochen sei. Wie soll er das nur erklären?
Der EDV-Bearbeiter hat auf seine Anfragen nur abgewunken: ‚Den Bericht können Sie frühestens in zwei Wochen haben’. Blieb wieder nur eine ungenaue Hochrechnung aus den alten Zahlen. Doch dass sich diese bewahrheitet, war von vornherein wenig wahrscheinlich - schließlich hat der Erzrivale zwei neue Konkurrenzprodukte herausgebracht.
Was sich anhört wie eine Erzählung aus den Urzeiten der Informationstechnik, ist in vielen Unternehmen immer noch bittere Realität. Mitarbeiter kommen an essentielle Informationen überhaupt nicht, nicht rechtzeitig oder nur unvollständig heran. Dabei sind sie im Unternehmen - zumindest grundsätzlich - vorhanden: Während der Fertigung entstehen laufend Produktionsdaten, die Marketingabteilung analysiert Zielgruppen, und beim Verkauf fallen Absatzinformationen an.
Für die beim täglichen Betrieb entstehenden Informationen ergeben sich auch neue Verwendungsweisen, wenn sie entsprechend verdichtet und angereichert werden. Integriert und regelmäßig auf den neuesten Stand gebracht, bilden diese Informationen ein Kundenprofil, aus dem sich gezielte Werbemaßnahmen ableiten lassen.
Data Warehouse, Data Mart, Information Warehouse, Data Mining, OLAP, ROLAP, MOLAP – allesamt sind Modeworte, die zu den Lieblingsthemen der Marktforscher gehören. „Data Warehouse hat als Beratungsprodukt den Aufstieg in die erste Liga des Consulting geschafft und gehört zu den Pflichtthemen der EDV-Abteilungsleiter.“[1] Es ist sogar zu einem Kapitel in der Wirtschaftsinformatik-Vorlesung der Hochschulen avanciert. Wenn sich so viele Parteien einig sind, dann liegt dies entweder an der Suggestivkraft der Begriffe oder es liegt an der tatsächlichen Leistungsfähigkeit der dahinter stehenden Konzepte und Produkte.[2]
Das Data Warehouse wird von den Herstellern häufig heruntergespielt nach dem Motto: Kaufen Sie meinen OLAP-Server, meine Consultants bauen ihren Multiwürfel in zwei Wochen
auf und Sie haben ein unternehmensweites Data Warehouse. Ein Data Warehouse ist jedoch kein Produkt, das schnell über den Ladentisch geht, sondern ein höchst komplexes Vorhaben. Diese Vorhaben umfasst unter anderem
- die Beschaffung von Softwareprodukten
- die Beschaffung neuer Hardware
- die Eigenentwicklung von Software
- das Customizing von Softwarekomponenten
- die Anwendung von Methoden der Systemanalyse
- Anpassungen der Organisationsstruktur (zum Beispiel wird eine Reihe neuer Spezialisten und eine Stelle namens Data Warehouse-Spezialist nötig)
und sogar Änderungen in der Geisteshaltung konventioneller EDV.[3]
„Das Data Warehouse-Konzept hat sich nicht als ‚Alter Wein in neuen Schläuchen’, sondern vielmehr als ein realisierbarer und effizienter Ansatz zur Verbesserung der unternehmensweiten Informationsversorgung herausgestellt.“[4] Bezeichnend für die Entwicklung der vergangenen Jahre ist die Tatsache, dass das Data Warehouse-Konzept inzwischen immer mehr in den Fachabteilungen Beachtung findet, wo es als ein wesentlicher Lösungsansatz zu bisher überhaupt nicht respektive nur unzureichend bearbeiteten Problemstellungen beiträgt.[5]
In dieser Hausarbeit möchte ich aufzeigen, was unter dem Begriff Data Warehouse und Data Warehouse-System zu verstehen ist, wie eine mögliche Architektur aussehen kann, welche Vorteile ein integriertes Data Warehouse-System bietet, welche Lösungen bisher bekannt sind und wie sich das Data Warehouse in der Fachabteilung CTG3 (Wirtschaftlichkeit und Rechnungswesen) der Robert Bosch Elektronik GmbH in Salzgitter als entscheidungsunterstützendes Hilfsmittel anbietet.
2. Data Warehouse-System
Zentrale Begrifflichkeiten der vorliegenden Arbeit sind in der Literatur und im allgemeinen Sprachgebrauch häufig mit den unterschiedlichsten Bedeutungen belegt. Um Missverständnisse und Fehlinterpretationen zu vermeiden, werden die Begriffe Data Warehouse, System und Data Warehouse-System im Detail berücksichtigt. Im folgenden werde ich den Begriff Data Warehouse mit DWH abkürzen.
2.1. Definition Data Warehouse
Das Konzept eines unternehmensweiten Datenpools wurde erstmals Anfang der 80er Jahre unter den Schlagworten Data Supermarket und Super Databases erwähnt. 1988 stellte die Firma IBM ein internes Projekt unter der Bezeichnung European Business Information System (EBIS) vor, dass 1991 in Information Warehouse Strategy umbenannt wurde.[6] Das in diesem Projekt entwickelte Konzept beinhaltet Produkte, Mechanismen und Vorgehensweisen zur Überwindung der Heterogenität und Bewältigung der Informationsexplosion. Als Ziel der Information Warehouse Strategy wird die Versorgung autorisierter Einzelpersonen mit zuverlässigen, zeitrichtigen, genauen und verständlichen Geschäftsinformationen aus allen Unternehmensbereichen zum Zwecke der Entscheidungsunterstützung genannt.[7] Damit sollte der Zugang zu unterschiedlichen Systemen über eine einheitliche Schnittstelle möglich sein.
Anfang der 90er Jahre wurde das IBM-Projekt EBIS als DWH-Konzept von verschiedenen Hardwareherstellern sowie Software- und Beratungshäusern aufgegriffen und als Dienstleistungspaket auf einem stark expandierenden Markt angeboten. „Wesentlich mit dazu beigetragen hat sicherlich die von F.E. Codd et al. (mit der Vorstellung ihrer 12 Regeln zum On-Line Analytical Processing (OLAP)) ins Leben gerufene Diskussion bezüglich der Schwächen relationaler Datenbanksysteme bei der Durchführung multidimensionaler betriebswirtschaftlicher Analysen.“[8] Aufgrund unterschiedlicher Voraussetzungen ist unter einem DWH daher keine umfassende Standard-Software, sondern stets eine unternehmensindividuelle Lösung zu verstehen.
Die bekannten Definitionen zum DWH unterscheiden sich vor allem im generellen Zweck eines DWH, im Umfang und Umgang der Daten im DWH.
Das Spektrum der Definitionen beginnt mit der restriktiven Sicht von Inmon:
„Ein Data Warehouse ist eine themenorientierte, integrierte, historisierte, nicht flüchtige (d.h. dauerhafte) Sammlung von Daten, um Manager bei Entscheidungsprozessen zu unterstützen.“[9]
Folgende Definition von Bauer und Günzel ist weniger restriktiv, ist aber auf einen speziellen Zweck, die Analysefunktion, ausgerichtet:
„Ein Data Warehouse ist eine physische Datenbank, die eine integrierte Sicht auf (beliebige) Daten darstellt, um Analysen zu ermöglichen.“[10]
Das Spektrum der Definitionen endet bei der Definition von Zeh, die ohne Restriktionen an Umfang und Umgang der Daten sowie ohne Zweckbestimmung ist:
„Ein Data Warehouse ist ein physischer Datenbestand, der eine integrierte Sicht auf die zugrundeliegenden Datenquellen ermöglicht.“[11]
Zusammenfassend kann man also sagen:
Data Warehouse (deutsch Datenlager) ist ein Datenbestand – meist eine Datenbank – dessen Inhalt durch Kopieren und Aufbereiten von Daten aus unterschiedlichen Quellen entsteht. Das DWH ist die zentrale Komponente eines DWH-Systems, in dem Daten aus den (betriebs) internen und -externen Datenquellen extrahiert werden, in Transformationsprogrammen bereinigt und strukturell vereinheitlicht werden, um danach in das DWH geladen zu werden. Dieser Extraktion-Transformation-Lade-Prozess (ETL-Prozess) kann turnusgemäß durchgeführt werden, so dass im DWH nicht nur Daten nach inhaltlichen Aspekten sondern auch nach dem Aspekt Zeit gehalten werden können.
2.2. Definition System
Jedes System besteht aus Elementen (Komponenten, Subsystemen), die untereinander in Beziehung stehen. Meist bedeuten diese Relationen ein wechselseitiges Beeinflussen - aus der Beziehung wird ein Zusammenhang. Ein System in diesem Sinn lässt sich durch die Definition zweckmäßiger Systemgrenzen von seiner Umwelt (den übrigen Systemen) weitgehend abgrenzen, um es modellhaft isoliert betrachten zu können.[12]
Bei Systemen unterscheidet man die Makro- und die Mikroebene: Auf der Makroebene befindet sich das System als Ganzes. Auf der Mikroebene befinden sich die Systemelemente.[13]
Strukturierung, Eigenschaften und Wechselwirkungen der Elemente auf der Mikroebene bestimmen die Eigenschaften des Gesamtsystems auf der Makroebene. Diese von der Mikroebene bestimmten Eigenschaften des Gesamtsystems bilden zugleich strukturelle Rahmenbedingungen, die steuernd auf die Elemente der Mikroebene einwirken.
Die Beziehungen (Relationen) zwischen den Elementen der Mikroebene sind Wirkungen von Austauschprozessen, wie zum Beispiel Stoff-, Energie- oder Informationsflüssen.
Das System selbst ist wiederum Teil eines Ensembles von Systemen und bestimmt mit ihnen die Eigenschaften eines übergeordneten Systems.[14]
2.3. Definition Data Warehouse-System
Ein DWH-System ist ein Informationssystem, das aus allen für den DWH-Prozess (engl. data warehousing) notwendigen Komponenten besteht. Dies sind mindestens der Datenbeschaffungsbereich (engl. staging area), in dem die aus den Datenquellen extrahierten Daten zusammengeführt und gegebenenfalls bereinigt und transformiert werden, und die zentrale DWH-Datenbank, das eigentliche DWH. Idealtypisch sind weitere Komponenten die für die Bereitstellung von bereichs- oder auswertungsspezifischen Sichten notwendigen Data-Marts und das Repositorium, der Speicher für die Metadaten sowie der DWH-Manager zur Ablaufsteuerung. Die DWH-Datenbank wird aus den unterschiedlichsten inner- und außerbetrieblichen Datenquellen gespeist. Auf Basis dieses integrierten Datenbestandes werden übergreifende Auswertungen möglich, die meist in den Data-Marts durchgeführt werden.
3. Architektur eines Data Warehouse-Systems
Eine DWH-System-Architektur besteht aus drei Schichten. Die erste Schicht ist die Transformations-/Extraktionsschicht. Hierbei werden Datenbestände aus verschiedenen (i.d.R. heterogenen) operativen Systemen in ein einheitliches DWH-Schema überführt. Scheduler[15] sorgen für eine periodische Aktualisierung der DWH-Datenbestände aus den operativen Systemen. Die zweite Schicht heißt Applikationsschicht oder auch OLAP-Schicht. Darunter versteht man das entgegennehmen von Anfragen und die Berechnung entsprechender Ergebnisse in Form multidimensionaler Datenwürfel. Die dritte Schicht letztendlich ist die Präsentationsschicht (Analyse-Schicht). Hier wird eine Möglichkeit zur Formulierung von Anfragen gestellt. Die Ergebnisse der Anfrage werden geeignet visualisiert.[16]
In der folgenden Abbildung stelle ich eine mögliche Referenz-Architektur für ein DWH-System dar:
Abbildung in dieser Leseprobe nicht enthalten
Abbildung 1: Data Warehouse-System[17]
Neben der Architektur wird das DWH-System wesentlich durch Prozesse beschrieben. Diese Prozesse stellen die eigentlichen Aufgaben dar, die eine DWH-Umgebung zu erfüllen hat. Folgerichtig stehen sie im Zentrum des Interesses, sobald die Grobarchitektur festgelegt ist.[18]
Eine mögliche sinnvolle Gliederung der Prozesse ergibt folgende Hauptprozesse mit Unterprozessen:[19]
- Nutzung
- Reporting
- OLAP
- Data Mining
- Informationsverteilung
- Betrieb
- Infrastruktur
- Service
- Datenversorgung
- Datenverteilung
- Archivierung
- Data Warehouse-Management
- Entwicklung/Weiterentwicklung
- Architektur
- Datenbasis/Datenquellen
- Data Marts
- Metadatenmanagement
- Management
Auf Grund der Komplexität des Themas werde ich nachfolgend nur einige ausgewählte Prozesse näher erörtern.
3.1. Nutzung
Unter Nutzung versteht man jeglichen Zugriff auf Informationen im Data Warehouse durch den Endbenutzer. Dies kann z.B. die unmittelbare Analyse von Informationen durch Endanwender sein, aber auch die mittelbare Nutzung von Informationen durch andere Systeme.[20] Diese mittelbare Nutzung kann durch Statistiksysteme, Reportingsysteme und Tabellenkalkulationen erfolgen. Im Grunde handelt es sich hierbei um eine Verteilung der Informationen. In dem Bereich Verteilung von Informationen sind außerdem eventuell Systeme anderer Unternehmensbereiche oder verbundener Unternehmen einzuordnen, mit denen eine entsprechende Nutzungsvereinbarung besteht.
[...]
[1] Höhn, Reinhard: Der Data Warehouse Spezialist. Entwurf, Methoden und Umsetzung eines Data Warehouses. München 2000, S. 11
[2] Vgl. Höhn, Reinhard: Der Data Warehouse Spezialist. Entwurf, Methoden und Umsetzung eines Data Warehouses. München 2000, S. 11
[3] Vgl. Höhn, Reinhard: Der Data Warehouse Spezialist. Entwurf, Methoden und Umsetzung eines Data Warehouses. München 2000, S. 11
[4] Muksch, H./ Behme, W. (Hrsg.): Das Data Warehouse-Konzept. Architektur – Datenmodelle – Anwendungen. 4. Auflage. Wiesbaden 2000, S. V
[5] Vgl. Muksch, H./ Behme, W. (Hrsg.): Das Data Warehouse-Konzept. Architektur – Datenmodelle – Anwendungen. 4. Auflage. Wiesbaden 2000, S. V
[6] Vgl. Muksch, H./ Behme, W. (Hrsg.): Das Data Warehouse-Konzept. Architektur – Datenmodelle – Anwendungen. 4. Auflage. Wiesbaden 2000, S. 5 f.
[7] Vgl. ebenda, S. 5f.
[8] ebenda, S 5.
[9] Wikipedia (Hrsg.): Die freie Enzyklopädie. Data Warehouse. 2005 verfügbar unter: http://de.wikipedia.org/wiki/Data_Warehouse, Stand 18.03.2005
[10] ebenda, Stand 18.03.2005
[11] ebenda, Stand 18.03.2005
[12] Vgl. ebenda, Stand 18.03.2005
[13] Vgl. Wikipedia (Hrsg.): Die freie Enzyklopädie. Definition System. 2005 verfügbar unter: http://de.wikipedia.org/wiki/System#Bedeutungen_des_Wortes_.22System.22, Stand 19.03.2005
[14] Vgl. ebenda, Stand 19.03.2005
[15] Bei dem EDV-Begriff Scheduler handelt es sich um ein Hilfsprogramm, das ein Anwendungsprogramm zu einem frei wählbaren Zeitpunkt startet, ohne dass der Anwender anwesend sein muss. Damit ist es zum Beispiel möglich, ein Backup in der Nacht durchzuführen. Scheduler wird in seltenen Fällen auch als Synonym für Terminplaner verwendet
[16] Vgl. Schmidt-Thieme, Lars: Datenbanken / Data Warehousing. Seite 2, verfügbar unter: http://www.informatik.uni-freiburg.de/cgnm/lehre/eb-03s/eb9.pdf, Stand 04.04.2005
[17] Sattler, Kai-Uwe, Conrad, Steffan: Vorlesung Data-Warehouse-Technologien. Folie 4, verfügbar unter: http://wwwiti.cs.uni-magdeburg.de/iti_db/lehre/dw/dw02.pdf, Stand 24.03.2005
[18] Vgl. Wieken, J.-H.: Der Weg zum Data-Warehouse. München 1999, S. 31
[19] Vgl. ebenda, S. 31f.
[20] Vgl. Wieken, J.-H.: Der Weg zum Data-Warehouse. München 1999, S. 31
- Arbeit zitieren
- Timo Arntz (Autor:in), 2005, Data Warehouse - Anforderungen an ein Unternehmen, München, GRIN Verlag, https://www.grin.com/document/39757
-
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen.