In dieser Arbeit wurde ein Vergleich von Data-Warehouse-Anwendungen durchgeführt. Dieser Vergleich richtet sich speziell an die Anforderungen mittelständischer Unternehmen. In der Arbeit werden sieben Anbieter von Data-Warehouse-Anwendungen verglichen. Die dafür erforderlichen Informationen wurden mit Hilfe eines Umfragebogens direkt bei den Anbietern erfragt und in mehreren Telefongesprächen diskutiert. Außerdem wurden mehrere Referenzkunden zu jedem Anbieter befragt. Diese Antworten sind ebenfalls in den Vergleich mit eingeflossen. Außerdem wurden die mittelstandsspezifischen Anforderungen auf einem Kongress (Cognos Performance 2007) von mehreren Experten bestätigt.
Diese Arbeit bietet mittelständischen Unternehmen eine Grundlage für die Auswahl eines Data Warehouse.
Inhaltsverzeichnis
1. EINLEITUNG
1.1 Gegenstand und Motivation
1.1.1 Gegenstand und Bedeutung
1.1.2 Problematik
1.1.3 Motivation
1.2 Zielsetzung
1.3 Vorgehensweise
2. GRUNDLAGEN.
2.1 Data Warehouse
2.1.1 Historische Entwicklung
2.1.2 Definitionen
2.1.3 Architektur eines Data-Warehouse-Systems
2.2 Mittelstand
3. ANFORDERUNGEN
3.1 Allgemeine Anforderungen
3.2 Datenbeschaffung
3.3 Modellierung
3.4 Speicherung
3.5 Analyse und Präsentation
3.6 Planungsunterstützung
4. MARKTÜBERSICHT
4.1 Anbieter eines Data Warehouse
4.2 Teilnehmende Anbieter
4.3 Befragung der Referenzkunden
5. AUSWERTUNG DER DATA-WAREHOUSE-ANWENDUNGEN
5.1 CP Corporate Planner
5.1.1 Auswertung des CP-Umfragebogens
5.1.2 Technische Eigenschaften
5.1.3 Beurteilung der Referenzkunden
5.1.4 Fazit
5.2 Excel Data InfoSuite
5.2.1 Auswertung des Excel Data-Umfragebogens
5.2.2 Technische Eigenschaften
5.2.3 Beurteilung der Referenzkunden
5.2.4 Fazit
5.3 Group1 Sagent Data Flow Solution
5.3.1 Auswertung des Group1-Umfragebogens
5.3.2 Technische Eigenschaften
5.3.3 Beurteilung der Referenzkunden
5.3.4 Fazit
5.4 HaPeC Xstream
5.4.1 Auswertung des HaPeC-Umfragebogens
5.4.2 Technische Eigenschaften
5.4.3 Beurteilung der Referenzkunden
5.4.4 Fazit
5.5 Oracle Business Intelligence Suite
5.5.1 Auswertung des Oracle-Umfragebogens
5.5.2 Technische Eigenschaften
5.5.3 Beurteilung der Referenzkunden
5.5.4 Fazit
5.6 PST-BI
5.6.1 Auswertung des PST-Umfragebogens
5.6.2 Technische Eigenschaften
5.6.3 Beurteilung der Referenzkunden
5.6.4 Fazit
5.7 SAP Business Warehouse
5.7.1 Auswertung des SAP-Umfragebogens
5.7.2 Technische Eigenschaften
5.7.3 Beurteilung der Referenzkunden
5.7.4 Fazit
6. Vergleich DER DATA-WAREHOUSE-ANWENDUNGEN
6.1 Allgemeine Informationen
6.2 Datenbeschaffung
6.3 Modelierung
6.4 Speicherung
6.5 Analyse und Präsentation
6.6 Planungsunterstützung
6.7 Repository
6.8 Bewertung der Referenzkunden
6.9 Gesamtbetrachtung des Vergleichs
7. DISKUSSION
7.1 Fazit
7.2 Ausblick
8. LITERATUR
8.1 Bücher und Magazine
8.2 Internetseiten
9. VERZEICHNISSE
9.1 Abbildungsverzeichnis
9.2 Tabellenverzeichnis
10. Anhang
10.1 Gegenüberstellung der Systeme
1. Einleitung
1.1 Gegenstand und Motivation:
1.1.1 Gegenstand und Bedeutung:
In der heutigen Zeit wird die Ressource Information für die Unternehmen immer wichtiger. Anhand guter Informationen können die richtigen Entscheidungen im Management eines Unternehmens getroffen und daraus resultierend Wettbewerbsvorteile gegenüber der Konkurrenz erzielt werden. Es stellt sich jedoch die Frage, wie ein Unternehmen an diese Informationen kommen soll. Meist liegen die benötigten Informationen dem Unternehmen bereits vor. Diese sind jedoch für sich alleine wenig aussagekräftig und meist über verschiedene Abteilungen und IT-Anwendungen verteilt.
Ein Data Warehouse schafft bei dieser Problematik Abhilfe. In diesem werden jegliche Daten gesammelt, aufbereitet und später in Form von Analysen und Statistiken ausgegeben, um anhand dieser Entscheidungen treffen zu können. Diese Systeme werden heute schon bei vielen Großunternehmen eingesetzt. Jedoch bieten Data-Warehouse-Systeme mittelständischen Unternehmen ebenfalls enorme Vorteile, da auch bei diesen viele vorhandene Informationen in unterschiedlichen IT-Systemen derzeit noch ungenutzt bleiben.
1.1.2 Problematik:
Zusätzlich zu der Vielzahl der auf dem Markt vorhandenen Lösungen kommen die vielen Anforderungen, welche die passende Lösung erfüllen sollte. Die Auswahl des richtigen Systems ist meist sehr kompliziert, da ein Data Warehouse ein sehr komplexes sowie kostenaufwendiges Projekt darstellt, was das folgende Zitat bestätigt: „Data-Warehouse-Systeme sind eine aus technischer Sichtweise hoch komplexe, meist orthogonal zu einer Organisationsstruktur stehende Infrastruktur, die einer fortwährenden Pflege und Entwicklung bedürfen.“ [Lehner, 2003, S. 15] Meist haben Unternehmen keine genauen Vorstellungen, welche Anforderungen ihre Lösung erfüllen sollte und können die entstehenden Kosten nicht einschätzen. Da besonders der Mittelstand auf wenige Erfahrungswerte zurückgreifen kann und über einen geringeren finanziellen Rahmen verfügt als Großunternehmen, wird die Auswahl des optimalen Systems zusätzlich erschwert.
1.1.3 Motivation:
Derzeit konzentrieren sich die Hersteller von Data-Warehouse-Anwendungen verstärkt auf den Mittelstand und bringen eigene Mittelstandslösungen auf dem Markt. Laut einer BARC-Studie nutzten erst 49% der mittelständischen Unternehmen Software zur Unternehmenssteuerung. Weiterhin planten 40% der Unternehmen den Einsatz von Business Intelligence Software. Unter Business Intelligence werden Systeme und Prozesse zusammengefasst, welche Daten im Unternehmen zur systematischen Analyse auswerten. „Business Intelligence (BI) hat sich von einer einstigen Spezial-Disziplin hin zu einem wichtigen und allgemein anerkannten Bestandteil betrieblicher Informationssysteme entwickelt“ [Chamoni/Gluchowski, 2004, S.52]
Abbildung in dieser Leseprobe nicht enthalten
Abb. 1.1.3a Einsatz von Software zur Unternehmenssteuerung [BARC (24/2007)]
„Zu den Kernaufgaben, bei denen Anwender, die auf Bl-Software setzen, zählt klassisches Reporting, also das Erstellen von Berichten und deren Verteilung im Unternehmen.“ [BARC (24/2007)] Diese Studie bestätigt, dass eine große Nachfrage gerade im Bereich Data Warehouse bei mittelständischen Unternehmen besteht, da besonders diese Systeme für die Berichterstellung zuständig sind.
Abbildung in dieser Leseprobe nicht enthalten
Abb. 1.1.3b Anwendungsfelder für BI-Software [BARC (24/2007)]
In einer weiteren Studie des IDC, dem weltweit führende Anbieter der IT-Marktbeobachtung und Beratung, wird „ein durchschnittliches Wachstum von 4,9% auf dem deutschen BI-Markt“, zu welchem die Data-Warehouse-Systeme gehören, „in den nächsten 2 Jahren erwartet“. Weiterhin soll „ein Volumen von über 360 Millionen Dollar alleine in Deutschland erreicht werden“ (siehe Abb. 1.3a). Laut einem Bericht, welcher bei ChannelPartner veröffentlicht wurde, sind „in diesem Betrag allerdings nur die Lizenz- und Unterhaltskosten der BI-Software enthalten. Zählt man auch noch Services hinzu, kommen andere Marktforscher auf Beträge jenseits der Eine-Milliarde-Euro-Marke.“ [ChannelPartner1]
Abbildung in dieser Leseprobe nicht enthalten
Abb. 1.3a Umsatzentwicklung des deutschen BI-Marktes [ChannelPartner1]
„In konkreten BI-Projekten gibt es keinen marktführenden Anbieter. So setzt nicht mal ein Viertel der Anwender eine BI-Lösung der bekannten Applikationsanbieter wie Cognos, SAS Institute, Business Objects oder Hyperion ein. BI-Plattform-Anbieter wie SAP oder Oracle kommen bei 14 Prozent der Projekte zum Zuge. Den Rest des Kuchens teilen sich Systemhäuser, Anbieterkonsortien, BI-Werkzeug-Hersteller, Datenbankspezialisten und Dienstleister“
Abbildung in dieser Leseprobe nicht enthalten
[ChannelPartner2]
Abb. 1.3b Verteilung BI-Anbieter [ChannelPartner2]
Aufgrund dieser Statistiken und des großen Engagements vieler Hersteller, spezielle Mittelstandslösungen anbieten zu können, resultiert der Bedarf eines Vergleiches der auf dem Markt befindlichen Data-Warehouse-Anwendungen, anhand der Anforderungen mittelständischer Unternehmen. Dieser Vergleich wird in dieser Arbeit vollzogen.
1.2 Zielsetzung:
Ziel dieser Arbeit ist es, einen Vergleich der am Markt befindlichen Data-Warehouse-Anwendungen anhand der Anforderungen eines mittelständischen Unternehmens durchzuführen. Dabei sind zum Einem relevante Kriterien aufzustellen und zum Anderem die Vor- und Nachteile der verschiedenen Systeme aufzudecken und diese miteinander zu vergleichen. Diese Arbeit soll mittelständischen Unternehmen bei der Auswahl eines Data Warehouse Hilfestellungen geben und einen Überblick über die derzeitige Marktsituation verschaffen.
1.3 Vorgehensweise:
Um diese Zielsetzung zu erfüllen werden die folgenden Punkte im Verlauf dieser Arbeit durchgeführt:
- Zusammentragen der Anforderungen, welche ein mittelständisches Unternehmen an ein Data Warehouse stellt
- Anfertigen eines Umfragebogens anhand der zuvor erarbeiteten Anforderungen
- Erstellen einer Liste von Anbietern, welche ein Data Warehouse für mittelständische Unternehmen anbieten
- Versenden des Umfragebogens an die in Frage kommenden Anbieter
- Sammeln von Informationen über die einzelnen Data-Warehouse-Systeme
- Kontaktieren der Referenzkunden, welche von den Anbietern angegebenen wurden
- Auswerten der zusammengetragenen Daten jedes Systems
- Vergleich der unterschiedlichen Systeme
2. Grundlagen
2.1 Data Warehouse:
„Im Bereich der analytischen Informationssysteme gibt es nur wenige Begriffe, die in den letzten Jahren häufiger erwähnt und diskutiert wurden als der des Data Warehouse. Viele Zeitungsartikel, Forschungsbeiträge und Produktinformationen propagieren zwar die Notwendigkeit eines Data Warehouse, es geht aber nie eindeutig hervor, worin die Charakteristika und der Nutzen eines Data Warehouse liegen.“ [Bauer/Günzel, 2004, S. 5]
2.1.1 Historische Entwicklung:
„Schon seit den sechziger Jahren versuchten Unternehmen, den Produktionsfaktor Information zur Unterstützung im Entscheidungsfindungsprozess zu nutzen“ [Schinzer/Bange/Mertens 1999, S. 1] Diese Systeme sind unter dem Namen „Management-Informations-System“ (MIS) bekannt.
Anfang der siebziger Jahre wurde versucht mit Hilfe von „Decision Support Systems“ (DSS) die Unternehmensleitung, durch die Bereitstellung komplexer Entscheidungsmodelle, zu unterstützen. Das Unternehmen sollte in seiner Entscheidungsfindung nicht nur auf vergangenheitsbezogene Informationen beschränkt sein, sondern auch die Möglichkeit erhalten, „What-If-Fragestellungen“ durchzuführen. Diese beiden Konzepte scheiterten jedoch aus technischen Gründen bereits im Ansatz, weshalb in den achtziger Jahren unter der Bezeichnung „Executive Information Systems“ (EIS) ein weiterer Versuch unternommen wurde.
Im Laufe der Jahre haben sich viele unterschiedliche Bezeichnungen entwickelt, bis der Begriff „Data Warehouse“ erstmals 1988 von Devlin gebraucht wurde. Seit wenigen Jahren ist jedoch eine Ablöse mit neueren Bezeichnungen zu verzeichnen. Die Synonyme „Business Intelligence Systeme“ finden immer häufiger Anwendung, da durch diese Begriffe verstärkt auf die geschäftliche Wichtigkeit hingewiesen wird. Im Vergleich zu früher haben sich die Systeme jedoch wesentlich verbessert. Heute Grundlegendes, welches als Voraussetzung für ein erfolgreiches Data Warehouse System gilt, „wie z.B.
- schnelle und flächendeckende Kommunikationstechnologien,
- graphische Benutzeroberflächen,
- ausreichende, kostengünstige und schnelle Datenspeicher,
- kostengünstige und leistungsfähige Prozessoren,
- große Datenbasen durch integrierte operative Systeme
fehlte in der damaligen technischen Infrastruktur.“ [Bauer/Günzel, 2004, S. 11] „Eine zusätzliche Verbesserung und Erweiterung dieser Systeme wurde durch die erstmalige Verwendung des Begriffs ‚OnLine Analytical Processing’ (OLAP) durch W.H. Inmon erreicht. Durch OLAP wurde aus der statistischen Analyse eine dynamische mit vielen verbesserten Funktionen.“ [Kurz, 1999, S. 51]
„Das Data Warehousing der 90er Jahre zielte in erster Linie darauf ab, alle entscheidungsrelevanten Informationen verfügbar zu machen, die bereits an irgendeiner Stelle im Unternehmen elektronisch gespeichert sind. Nicht zuletzt durch die zunehmende Verbreitung der geschäftsprozessorientierten Transaktionssysteme (z.B. SAP/R3) ist im Unternehmen ein großes Volumen an potenziell entscheidungrelevanten Informationen vorhanden. Idealerweise sollen in einem Data-Warehouse-System darüber hinaus auch Informationen aus externen Informationssystemen integriert werden.“ [Bauer/Günzel 2004, S. 12]
Abbildung in dieser Leseprobe nicht enthalten
Abb. 2.1.1 Entwicklung der Managementunterstützungssysteme im Zeitverlauf [Informatik-Spektrum, 23.02.2005, S. 4]
2.1.2 Definitionen:
Der Begriff „Data Warehouse“ wurde maßgeblich von W. H. Immon geprägt, welcher die folgende Definition veröffentlichte:
„A data warehouse is a subject-oriented, integrated, non-volatile, time-variant collection of data in support of management´s decision-making process.“ [Inmon, 1996, S. 33]
Übersetzt: „Ein Data Warehouse ist eine themenorientierte, integrierte, chronologisierte und persistente Sammlung von Daten, um das Management bei seinen Entscheidungsprozessen zu unterstützen.“
„Ein Data Warehouse hat seiner Ansicht nach also vier Eigenschaften, die alle der Entscheidungsunterstützung dienen. Die Eigenschaften sollen hier kurz skizziert werden:
- Fachorientierung (engl. subject-oriented): Der Zweck der Datenbasis liegt nicht mehr auf der Erfüllung einer Aufgabe wie eine Personaldatenverwaltung, sondern auf der Modellierung eines spezifischen Anwendungsziels.
- Integrierte Datenbasis (engl. integration): Die Datenverarbeitung findet auf integrierten Daten aus mehreren Datenbanken statt.
- Nicht flüchtige Datenbasis (engl. non-volatile): Die Datenbasis ist als stabil zu betrachten. Daten, die einmal in das Data Warehouse eingebracht wurden, werden nicht mehr entfernt oder geändert.
- Historische Daten (engl. time variance): Die Verarbeitung der Daten ist so angelegt, dass vor allem Vergleiche über die Zeit stattfinden können. Es ist dazu unumgänglich, Daten über einen längeren Zeitraum zu halten.“
[Bauer/Günzel, 2004, S. 7]
2.1.3 Architektur eines Data Warehouse:
Die Architektur eines Data Warehouse besteht aus den drei Ebenen „Datenbereitstellung“, „Datenhaltung“ sowie „Informationspräsentation“. Jedoch wird in diesem Kapitel nicht weiter auf diese Ebenen eingegangen, da diese einen Teil der Anforderungen darstellen und zu einem späteren Zeitpunkt genauer erläutert werden.
Abbildung in dieser Leseprobe nicht enthalten
Abb. 2.1.3 Architektur eines Data-Warehouses
[Prof. Dr.-Ing. habil. Kai-Uwe Sattler, TU Ilmenau, DW-Skript2, S. 7]
2.2 Mittelstand:
Die Anforderungen, anhand welcher die Data-Warehouse-Anwendungen verglichen werden sollen, beziehen sich auf mittelständische Unternehmen. Aus diesem Grund muss zu Beginn der Arbeit eine einheitliche Definition des Mittelstands verfasst werden. Anhand dieser Definition werden zu einem späteren Zeitpunkt die Anforderungen an die Data-Warehouse-Anwendungen erarbeitet. Es existieren mehrere unterschiedliche Definitionen bezüglich des Mittelstands, welche meist mit unterschiedlichen Werten, oft jedoch mit den gleichen Kennzahlen arbeiten.
Das Institut für Mittelstandsforschung Bonn (IfM) definiert Unternehmensgrößen über die Kennzahlen „Anzahl der Beschäftigten“ sowie „Umsatz in €/Jahr“. Unternehmen mit 10 - 499 Beschäftigten beziehungsweise einem Umsatz zwischen einer und 50 Millionen €/Jahr gehören laut dem IfM dem Mittelstand an.
Abbildung in dieser Leseprobe nicht enthalten
Abb. 2.2.1 Unternehmensgrößen
Es wurde die vorliegende Definition gewählt, da bei diesen Unternehmen der größte Bedarf an Data-Warehouse-Anwendungen besteht. Bei Unternehmen mit weniger als zehn Beschäftigen besteht kein akuter Bedarf bezüglich eines Data Warehouse. Außerdem wären die entstehenden Kosten zu groß beziehungsweise der zusätzliche Informationsgewinn in Relation zum Aufwand zu gering. Bei Unternehmen mit mehr als 500 Beschäftigten werden häufig bereits Lösungen eingesetzt. Weiterhin können diese Unternehmen bereits zu Großunternehmen gezählt werden und sind somit nicht Gegenstand dieser Arbeit.
Diese Arbeit geht speziell auf die Anforderungen eines mittelständischen Unternehmens ein. „Auch für diese Unternehmen stellt sich vermehrt die Frage, wie es um die Aktualität, die Verfügbarkeit und die Entwicklungsfähigkeit des betrieblichen Wissens steht und welche Maßnahmen unternehmensseitig in Bezug auf den Produktionsfaktor Wissen getroffen wurden, kurzum, wie es um die betriebliche Wissensnutzung bestellt ist. Allerdings ist zu berücksichtigen, dass kleine und mittlere Unternehmen in wesentlichen Punkten andere Voraussetzungen als Großunternehmen aufweisen.“ [Bergrath, 2004, S. 9] Dieses Wissen kann mit Hilfe eines Data Warehouse analysiert und in Folge dessen verwendet werden.
3. Anforderungen
Der folgende Anforderungskatalog wurde anhand der Anforderungen, welche mittelständische Unternehmen an eine Data-Warehouse-Anwendung stellen, angefertigt. Der Katalog enthält sechs Punkte, welche die unterschiedlichen Anforderungsgebiete abdecken. Besonders wichtig für mittelständische Unternehmen sind geringe Kosten, ein möglichst geringer Aufwand für den Betrieb des Data Warehouse, eine geringe Einführungszeit sowie die einfache Bedienbarkeit für Mitarbeiter ohne tiefgreifende Fachkenntnisse. Diese Punkte wurden auf der „Cognos Performace 2007“ in Nürnberg, sowohl von verschiedenen Herstellern, als auch von Interessenten mehrfach angegeben. Jedoch spielen die anderen aufgelisteten Punkte ebenfalls eine Rolle.
3.1 Allgemeine Anforderungen:
Unter diesem Punkt wird auf die allgemeinen Anforderungen eingegangen, welche der Anbieter einer Data-Warehouse-Anwendung erfüllen muss, um ein mittelständisches Unternehmen mit seinem Produkt zufrieden stellen zu können.
3.1.1 Informationen über den Anbieter und das Produkt :
Es ist darauf zu achten, dass der Anbieter des Data Warehouse bereits möglichst viel Erfahrung mit der Einführung und dem Betrieb von Data-Warehouse-Anwendungen gesammelt hat. Die Anzahl der Installationen in mittelständischen Unternehmen ist sehr relevant für die Auswahl des richtigen Anbieters. Weiterhin ist darauf zu achten, dass der Hersteller möglichst viel Know-how sowie branchenspezifische Realisierungen besitzt. Es sollte auf Referenzkunden aus dem Mittelstand und deren Erfahrungen mit dem Anbieter zurückgegriffen werden. Weiterhin sollte sichergestellt sein, dass der Anbieter sein Produkt durch Updates laufend verbessert. Da sich dieser Vergleich auf die Anforderungen von mittelständischen Unternehmen bezieht, wäre es vorteilhaft, wenn eine spezielle Data-Warehouse-Anwendung für den Mittelstand angeboten würde.
3.1.2 Kosten der Data-Warehouse-Anwendung :
Ein sehr wichtiger Faktor bei der Auswahl des richtigen Systems sind die Kosten der Anwendung. Diese setzen sich aus den einmaligen sowie den laufenden Kosten zusammen. Unter den einmaligen Kosten werden die Lizenzkosten, die Hardwarekosten, die Basissoftwarekosten und die Kosten der Projekteinführung des Data Warehouse zusammengefasst. Gerade bei mittelständischen Unternehmen ist meist zusätzliche Hardware erforderlich, da die Unternehmen nicht über genügend Ressourcen verfügen. Bezüglich der Projekteinführungskosten wird sich zusätzlich später an die angegebenen Referenzkunden gewendet, da dies ist ein sehr wichtiger Faktor bei der Auswahl des richtigen Systems und eine entscheidende Rolle bei der Auswahl des richtigen Systems spielen kann.
Zu den laufenden Kosten zählen die Wartungsgebühren sowie der Aufwand zum Betrieb des Systems und deren Wartung und Weiterentwicklung. Hier wird sich jedoch ebenfalls zu einem späteren Zeitpunkt direkt an die Referenzkunden gewendet, um herauszufinden, ob dies von eigenen Mitarbeitern übernommen werden können. Dies würde gerade dem Mittelstand entgegenkommen und wird als ein sehr wichtiger Faktor angesehen.
3.1.3 Vollständigkeit:
Ein weiteres Kriterium ist die Vollständigkeit des Systems. Hierbei ist darauf zu achten, dass die Data-Warehouse-Anwendung alle anfallenden Aufgaben abdeckt, ohne weitere Komponenten von Drittanbietern einbinden zu müssen. Diese könnten zusätzliche Kosten sowie eine Einschränkung der Funktionalität und der Bedienbarkeit des Systems zu Folge haben. Des Weiteren ist es gerade für den Mittelstand schwierig für einen Anwendungsbereich die Produkte mehrerer Anbieter gleichzeitig zu nutzen. Das Bedürfnis des Mittelstandes liegt stärker darin, möglichst die Produkte eines Herstellers zu nutzen. Es sollten sowohl Werkzeuge zur Datenbeschaffung, Werkzeug zur Datenmodellierung, Analyse- und Planungstools sowie die benötigte Datenbanken bereitgestellt werden.
3.1.4 Plattformunabhängigkeit :
Das Data Warehouse sollte auf möglichst vielen Betriebssystemen einwandfrei lauffähig sein. Selbst in mittelständischen Unternehmen werden mehrere unterschiedliche Betriebssysteme eingesetzt. Die am häufigsten auf Clientseite Verwendeten sind Windows XP, Windows NT/2000 und zunehmend Windows Vista. Jedoch wäre es vorteilhaft, wenn sämtliche Linux Versionen unterstützt werden. Auf Serverseite sollten Microsoft Windows Server 2003, Windows NT/2000, Unix, Solaris, Linux und IBM unterstützt werden.
3.1.5 Betreuung :
Es ist wichtig, dass der Anbieter der Data-Warehouse-Anwendung eine umfassende Betreuung liefert. Zu dieser Betreuung zählen die Verfügbarkeit einer Hotline, an welche sich die Anwender bei Problemen wenden können, sowie die Verfügbarkeit von Mitarbeitern des Anbieters in der näheren Umgebung. Dies kommt gerade dem Mittelstand entgegen, da dieser keine speziellen Data-Warehouse-Fachkräfte im Unternehmen beschäftigt. Außerdem sollten gegebenenfalls Schulungen der Mitarbeiter angeboten werden. Unter diesem Punkt muss jedoch unterschieden werden, ob die Serviceleistungen bereits im Standardpreis enthalten sind oder ob zusätzliche Kosten entstehen.
3.1.6 Hilfsfunktionen :
Zusätzlich zu der Betreuung sollten Hilfsfunktionen direkt im System vorhanden sein. Mit Hilfe dieser können sich die Benutzer bei kleineren Problemen selbst helfen. Dies erspart Zeit und unter Umständen Geld für die Betreuung. Außerdem wäre es hilfreich, wenn die Anwender auf ein Nachschlagewerk zurückgreifen könnten.
3.1.7 Sprachvarianten :
Da mittelständische Unternehmen Niederlassungen im Ausland gegebenenfalls an die Data-Warehouse-Anwendung angliedern möchten, spielen Sprachvarianten eine große Rolle. Zumindest die englische Sprache sollte das System neben der deutschen Sprache unterstützen.
3.2 Datenbeschaffung :
Unter dem Punkt Datenbeschaffung werden alle Faktoren zusammengefasst, welche dazu beitragen, die benötigten Daten des Unternehmens in das Data Warehouse zu integrieren und zu formatieren. Diese Prozesse werden meist unter ETL zusammengefasst. „Er ist erwiesenermaßen der wichtigste Prozessschritt in diesem Modell, da hier das Fundament für den Erfolg aller nachträglichen Analyseaufgaben gelegt wird.“ [Egger/Fiechter/Salzmann/Sawicki/Thielen, 2005, S. 43] „Untersuchungen, die auf Immon zurückgehen, schätzen den Aufwand von Extraktion, Bereinigung und Laden der Daten in das Data-Warehouse-System auf bis zu 70% des gesamten Projektes.“ [Schütte/Rotthowe/Holten 2001, S.171] Dies ist ein sehr wichtiger Punkt bei der Auswahl des richtigen Systems, da die Qualität der Daten sehr großen Einfluss auf die späteren Analysen hat.
3.2.1 Extraktion :
Die Extraktion ist der erste Schritt des ETL-Prozesses. „Im Extraktionsschritt werden die von den Benutzern benötigten Daten aus den unterschiedlichen heterogenen operativen Datenquellen zusammengezogen, um sie anschließend im Data-Warehouse zu lagern.“ [Egger/Fiechter/Salzmann/Sawicki/Thielen, 2005, S. 45] Die Extraktion wird in die folgenden zwei Punkte „unterstützte Schnittstellen“ sowie „Datenquellen“ unterteilt.
3.1.2 Un terstützte Schnittstellen :
Die Voraussetzung der Integration der benötigten Daten ist die Unterstützung verschiedener Schnittstellen, über welche auf die unterschiedlichen Programme zugegriffen werden kann. Heute werden größtenteils indirekte Schnittstellen (z.B. ODBC) verwendet, da diese nicht laufend an die Systeme angepasst werden müssen. Diese sind sowohl in Großunternehmen als auch in mittelständischen Unternehmen weit verbreitet. Zusätzlich sollte die SAP Schnittstelle BAPI sowie OLE DB bzw. OLE DB FOR OLAP und sonstige Schnittstellen unterstützt werden.
3.2.2 Unterstützte Datenquellen :
Als Datenquellen werden die Systeme verstanden, aus welchen das Data Warehouse die benötigten Daten bezieht. Dies sind meist ERP-Standardsysteme für mittelständische Unternehmen, Office Produkte oder Datenbanken. Hierbei ist es wichtig, dass das Data Warehouse Daten aus allen im Unternehmen vorliegenden Datenquellen beziehen kann. Im Mittelstand wird besonders viel mit den MS Office Produkten sowie mit SAP-Produkten gearbeitet. Gerade SAP setzt in letzter Zeit verstärkt auf den Mittelstand. 65% aller SAP Kunden gehörten laut Firmenangaben zum Mittelstand. [SAP Mittelstand] Jedoch definiert SAP den Mittelstand anders als in dieser Arbeit. Gegebenenfalls sollte es möglich sein, Daten aus dem Internet zu integrieren. Außerdem wäre es hilfreich, wenn Daten aus Flat Files integriert werden könnten. Eine große Anzahl an verwendeten Datenquellen ist sehr wichtig für die Auswahl des Systems.
Insgesamt sollten Daten aus den ERP-Systemen der Unternehmen SAP, Microsoft, Infor Global Solution, Sage, Abas Software sowie sonstigen Anbietern als Datenquelle unterstützt werden sowie Daten aus den Datenbanken DB2, Oracle, Oracle Express, MS SQL Server, Synbase, Informix, dBASE, InterBase , Lotus Notes, MySQL, SQLite , Teradata sowie sonstige Datenbanken bezogen werden können.
3.2.2 Transformation :
Um die Daten aus den unterschiedlichen Datenquellen in ein einheitliches Format zu bringen, müssen diese transformiert werden. Bei der Transformation werden die Daten an die vorgegebenen Zielstrukturen angepasst. Ebenso umfasst die Transformation die aufwändige Datenbereinigung der Rohdaten sowie spezifischer Formate der Quellsysteme.
3.2.2.1 Datenintegration :
Bei der Datenintegration ist darauf zu achten, dass die Daten möglichst ohne Programmierkenntnisse in das vorhandene Datenmodell integriert werden können. Diese Daten sollten automatisiert in die im Datenmodell hinterlegten Formate überführt werden. SAP und Mircosoft verwenden beispielsweise unterschiedliche Datumsformate, welche automatisch in ein einheitliches Format transformiert werden müssen. Außerdem sollten bei der Datenintegration Dateninkonsistenten sowie Datenfehler aufgedeckt werden. Es ist gerade im Mittelstand sehr wichtig, dass solche Transformierungen automatisch ablaufen, da meist kein zusätzliches Personal für diese Aufgaben zur Verfügung steht. Im Folgenden werden die wichtigsten Operationen aufgelistet, welche vorausgesetzt werden:
– Vereinheitlichung von Datumsangaben
– Umrechnung von Währungen
– Umrechnung von Maßstäben
– Anpassung von Datentypen
– Vereinheitlichung von Zeichenketten
– sonstige Operationen
Außerdem sollten Prüfregeln festgelegt werden können, anhand welcher geprüft werden kann, ob die Werte korrekt sind. Weiterhin sollte es Möglichkeiten geben Filter einzubinden, um gegebenenfalls Daten zu selektieren. Diese Operationen werden vorausgesetzt, da eine möglichst gut formatierte und strukturierte Datenbasis ein wichtiger Punkt des Data Warehouse ist.
3.2.2.2 Fehlerbehandlung :
Da nicht davon auszugehen ist, dass die Integration der Daten immer reibungslos funktioniert, wird eine gute Fehlerbehandlung vorausgesetzt. Diese könnte beispielsweise durch ein Protokollieren der fehlgeschlagenen Datensätze erfolgen, welche später vom Administrator mit möglichst wenig Aufwand manuell integriert werden könnten. Außerdem sollte das System mögliche Inkonsistenten vermeiden, indem es alle abhängigen Änderungen zurücksetzt. Gerade im Mittelstand sollten alle Daten korrekt interpretiert werden, da dank der geringeren Datenmenge im Vergleich zu Großunternehmen falsche Informationen stärker ins Gewicht fallen. Zusammengefasst sollte eine Protokollierung der fehlgeschlagenen Integrationen, eine manuelle Nachbearbeitung, ein Zurücksetzen von abhängigen Änderungen, eine E-Mail-Benachrichtigung für Administratoren, automatische Skripte zur Fehlerbehandlung und sonstige Funktionen zur Verfügung stehen.
3.2.3 Laden :
Unter dem Laden der Daten wird Transfer der Daten aus dem Arbeitsbereich in das Data Warehouse verstanden. Dies soll in der Regel möglichst effizient geschehen, sodass die Datenbank während des Ladens nicht oder nur kurz blockiert und ihre Integrität gewahrt wird.
3.2.3.1 A utomatische Ladevorgänge :
Da die Daten aus den verschiedenen Datenquellen nicht nur bei der Einführung des Data Warehouse in dieses integriert werden, sondern der Datenbestand regelmäßig erweitert werden soll, ist dieser Prozess ein weiterer Faktor bei der Auswahl des richtigen Systems. Dieser Prozess sollte automatisch durchgeführt werden können. Weiterhin ist es wichtig, den Zeitpunkt der Durchführung sowie das Intervall der Extraktion neuer Daten frei wählen zu können. In mittelständischen Unternehmen bietet es sich an, diesen Prozess über Nacht oder über das Wochenende laufen zu lassen, da dadurch die begrenzten Ressourcen nicht zu sehr beansprucht werden. Außerdem ist durch die Wahl dieses Zeitpunktes gewährleistet, dass an den zu integrierten Daten nicht gearbeitet wird.
3.2.4 A llgemeine Kriterien :
Zusätzlich zu dem ETL-Prozess sollten die folgenden Kriterien erfüllt werden, die den Prozess der Datenintegration erleichtern:
3.2.4.1 Metadaten :
„Parallel zur Datenbeschaffung müssen auch die relevanten Metadaten berücksichtigt werden. Dies beinhaltet das Management aller Arten von Metadaten (technische, administrative, businessrelevante etc.). Ein zentrales, integriertes Metadaten-Repository ist eine Voraussetzung für eine effiziente und benutzerfreundliche Administration des Data Warehouse. Es erlaubt den transparenten und übereinstimmenden Zugriff – von allen Komponenten der Business-Intelligence-Lösung – auf die Daten. So können Änderungen in einem Prozess (z.B. ETL) nahtlos an alle anderen Prozesse weitergeleitet werden (z.B. an die Endbenutzer-Analyse-Werkzeuge).“ [Egger/Fiechter/Salzmann/Sawicki/Thielen, 2005, S. 51] Auf ein solches Repository wird zu einem späteren Zeitpunkt nochmals genauer eingegangen. Weiterhin sollten die Speicherung und die Verwaltung von Metadaten im Data Dictonary sowie eine Übernahme von Metadaten aus anderen Systemen möglich sein.
[...]
- Arbeit zitieren
- Bachelor of Science in Computer Science Michael Bresik (Autor:in), 2007, Vergleich von Data-Warehouse-Anwendungen anhand der Anforderungen mittelständischer Unternehmen, München, GRIN Verlag, https://www.grin.com/document/84055
-
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen.