Diese Bachelorarbeit zeigt den Entwurf und die Realisierung eines ETL-Prozesses, worüber ein automatisierter Datenexport aus SAP BW in eine relationale Datenbank durchgeführt wird. Desweiteren wird ein Prototyp einer Software zur Berechnung von Prognosen erstellt. Die berechneten Prognosen werden im Anschluss über eine File-Schnittstelle aus der Datenbank zurück in das SAP Business Warehouse geladen.
Zu Beginn werden verschiedene ETL-Tools aus dem SAP- und NON-SAP Umfeld gegenübergestellt und bewertet. Die Realisierung des ETL-Prozesses wird beispielhaft mit einem der evaluierten ETL-Tools durchgeführt.
Neben den Extraktionsmöglichkeiten werden wichtige grundlegende Technologien aus dem SAP und NON-SAP Umfeld vorgestellt, die bei der Umsetzung zum Einsatz kommen. Die Extraktion, Transformation und das Loading findet zwischen dem SAP BW System und einer relationalen Datenbank statt. Bei der Beschreibung der Umsetzung geht der Autor hauptsächlich auf die Möglichkeiten der Extraktion von Daten aus dem SAP BW System ein.
Die letztliche Betrachtung der Arbeit bringt das Ergebnis, dass die Anforderungen an den ETL-Prozess erfüllt und die Datenlieferung aus dem BW mit Hilfe eine 3rd-Party-Tools automatisiert werden kann.
Inhaltsverzeichnis
- 1. Einleitung
- 1.1 Zielsetzung und Abgrenzung
- 1.2 Aufbau der Arbeit
- 1.3 Überblick
- 2. Grundlegende Technologien
- 2.1 Relationale Datenbanksysteme (RDBS)
- 2.2 Data Warehouse
- 2.2.1 Definition
- 2.2.2 Nutzen
- 2.2.3 Abgrenzung des Begriffs Business Intelligence
- 2.3 Extract, Transform & Load (ETL)
- 2.3.1 Extraktion
- 2.3.2 Transformation
- 2.3.3 Laden
- 2.4 SAP Business Warehouse
- 2.4.1 Extraktionsschicht
- 2.4.2 Data Warehouse-Schicht
- 3. SAP BW Standardschnittstellen
- 3.1 DB Connect
- 3.2 XML-Schnittstelle
- 3.3 Universal Data Integration (UDI)
- 3.3.1 UD Connect
- 3.3.2 BI Java Software Development Kit (BI Java SDK)
- 3.4 File-Schnittstelle
- 3.5 Business Application Programming Interface (BAPI)
- 3.5.1 Remote Function Call (RFC)
- 3.5.2 BW Service Application Programming Interface (SAPI)
- 3.6 SAP Java Connector
- 3.6.1 SAP Java Resource Adapter
- 3.7 SAP Business Connector
- 3.7.1 Internet Communication Framework (ICF)
- 3.8 Open Hub Services
- 3.9.1 Import
- 3.9.2 Export
- 3.9 Eignung der Schnittstellen für die Umsetzung
- 4. Evaluierung von 3rd-party-ETL-Tools
- 4.1 Xtract IS
- 4.2 Palo Suite
- 4.3 Pentaho Data Integration
- 4.4 Talend Open Studio
- 4.5 Sonstige
- 4.6 Fazit
- 5. Export der Daten aus SAP BW
- 5.1 Vorbereitung in SAP BW
- 5.1.1 InfoCube anlegen
- 5.1.2 Data Store Objekt anlegen
- 5.2 Vorbereitung in Palo ETL
- 5.2.1 Variablen
- 5.2.2 Verbindungen
- 5.3 Extraktion der Daten
- 5.4 Aufbereiten der Daten für die Berechnung
- 6. Berechnung der Prognosen
- 6.1 Java
- 6.2 Anforderungen an die Anwendung
- 6.3 Entwicklung der Anwendung
- 6.4 Funktionalität der Anwendung
- 6.4.1 Funktionen und Erweiterungen im Überblick
- 7. Import der Prognosen in SAP BW
- 7.1 Export der Prognosewerte in ein Flat File
- 7.2 Erstellen eines neuen InfoCubes in SAP BW
- 7.3 Erstellung einer DataSource für die Flat File
- 7.4 Import der berechneten Daten
- 8. Zusammenfassung
- 8.1 Fazit
- 8.2 Erweiterungsmöglichkeiten
- 8.2.1 Dynamischer Exportprozess
- 8.2.2 Automatisierung des Reimports
- 8.2.3 ETL-Controller Update
Zielsetzung und Themenschwerpunkte
Diese Bachelorarbeit befasst sich mit dem Entwurf und der Implementierung eines ETL-Prozesses für den automatisierten Datenaustausch zwischen SAP BW und relationalen Datenbanken. Ziel ist die Entwicklung einer effizienten Lösung für den Datenexport aus dem SAP BW und die anschließende Verwendung dieser Daten zur Prognoseberechnung. Die Ergebnisse werden wiederum ins SAP BW importiert.
- Evaluierung verschiedener ETL-Tools
- Implementierung eines ETL-Prozesses mit einem ausgewählten Tool
- Entwicklung einer Prognose-Software
- Automatisierung des Datenimports und -exports
- Beschreibung relevanter Technologien aus SAP und Non-SAP Umgebungen
Zusammenfassung der Kapitel
1. Einleitung: Dieses Kapitel führt in die Thematik der Bachelorarbeit ein, beschreibt die Zielsetzung und Abgrenzung des Projekts und gibt einen Überblick über den Aufbau der Arbeit. Es legt den Fokus auf den Entwurf und die Entwicklung eines automatisierten ETL-Prozesses zwischen SAP BW und relationalen Datenbanken, der die Grundlage für Prognoseberechnungen bildet.
2. Grundlegende Technologien: Dieses Kapitel erläutert die grundlegenden Technologien, die für den ETL-Prozess relevant sind. Es definiert relationale Datenbanken, Data Warehouses und den ETL-Prozess selbst, wobei die Extraktion, Transformation und das Laden von Daten detailliert beschrieben werden. Der Schwerpunkt liegt auf der Beschreibung von Data Warehouses, insbesondere deren Nutzen und Abgrenzung von Business Intelligence. Zusätzlich wird das SAP Business Warehouse als zentrales System eingeführt.
3. SAP BW Standardschnittstellen: Dieses Kapitel präsentiert eine detaillierte Übersicht verschiedener Standardschnittstellen des SAP BW, die für den Datenaustausch genutzt werden können. Es beschreibt die Funktionsweise und Eignung jeder Schnittstelle (DB Connect, XML-Schnittstelle, UDI, File-Schnittstelle, BAPI, SAP Java Connector, SAP Business Connector, Open Hub Services) für die geplante Umsetzung des ETL-Prozesses. Der Vergleich der Schnittstellen dient der fundierten Auswahl der geeignetsten Methode für den Datenexport und -import.
4. Evaluierung von 3rd-party-ETL-Tools: In diesem Kapitel werden verschiedene Drittanbieter-ETL-Tools (Xtract IS, Palo Suite, Pentaho Data Integration, Talend Open Studio und weitere) evaluiert und miteinander verglichen. Die Bewertungskriterien umfassen Funktionalität, Benutzerfreundlichkeit, Kosten und Integrationsfähigkeit mit SAP BW. Diese Evaluierung dient der fundierten Entscheidung für das am besten geeignete Tool zur Realisierung des ETL-Prozesses.
5. Export der Daten aus SAP BW: Dieses Kapitel beschreibt detailliert den Exportprozess der Daten aus dem SAP BW. Es umfasst die Vorbereitungsschritte in SAP BW (Anlegen von InfoCubes und Data Store Objekten), die Konfiguration des gewählten ETL-Tools (hier Palo ETL) inklusive der Definition von Variablen und Verbindungen und den eigentlichen Extraktionsprozess. Der Fokus liegt auf der technischen Umsetzung und den notwendigen Schritten zur Datenextraktion.
6. Berechnung der Prognosen: Dieses Kapitel befasst sich mit der Entwicklung einer Java-Anwendung zur Berechnung von Prognosen basierend auf den aus dem SAP BW exportierten Daten. Es beschreibt die Anforderungen an die Anwendung, den Entwicklungsprozess und die finale Funktionalität inklusive der Übersicht über Funktionen und Erweiterungen. Der Schwerpunkt liegt auf der Programmierung und der Funktionalität der Prognoseberechnung.
7. Import der Prognosen in SAP BW: Das Kapitel beschreibt den Import der berechneten Prognosen zurück in das SAP BW System. Es beinhaltet den Export der Prognosewerte in eine Flat File, das Erstellen eines neuen InfoCubes und einer DataSource, sowie den Import der Daten. Der Fokus liegt auf den technischen Schritten und der Integration der berechneten Prognosen in das SAP BW System.
Schlüsselwörter
SAP BW, relationale Datenbanken, ETL-Prozess, Data Warehouse, Data Mining, Prognoseberechnung, Palo ETL Suite, Java, Datenextraktion, Datentransformation, Datenintegration, 3rd-Party-Tools
Häufig gestellte Fragen (FAQ) zur Bachelorarbeit: Automatisierter ETL-Prozess zwischen SAP BW und relationalen Datenbanken
Was ist das Thema der Bachelorarbeit?
Die Bachelorarbeit befasst sich mit dem Entwurf und der Implementierung eines automatisierten ETL-Prozesses für den Datenaustausch zwischen SAP BW und relationalen Datenbanken. Ziel ist die Entwicklung einer effizienten Lösung für den Datenexport aus dem SAP BW, die Verwendung dieser Daten zur Prognoseberechnung und der anschließende Reimport der Ergebnisse ins SAP BW.
Welche Technologien werden in der Arbeit behandelt?
Die Arbeit behandelt verschiedene relevante Technologien, darunter relationale Datenbanken (RDBS), Data Warehouses, den ETL-Prozess (Extract, Transform, Load), SAP Business Warehouse (BW), verschiedene SAP BW Standardschnittstellen (DB Connect, XML-Schnittstelle, UDI, File-Schnittstelle, BAPI, SAP Java Connector, SAP Business Connector, Open Hub Services) und verschiedene 3rd-Party-ETL-Tools (Xtract IS, Palo Suite, Pentaho Data Integration, Talend Open Studio).
Welche Zielsetzung verfolgt die Arbeit?
Die Hauptzielsetzung ist die Entwicklung eines automatisierten ETL-Prozesses, der den effizienten Export von Daten aus SAP BW ermöglicht, die Daten für Prognoseberechnungen aufbereitet und die berechneten Prognosen wieder in das SAP BW importiert. Die Arbeit evaluiert verschiedene ETL-Tools und implementiert eine Lösung mit einem ausgewählten Tool. Ein weiterer Schwerpunkt liegt auf der Entwicklung einer Java-Anwendung für die Prognoseberechnung.
Welche ETL-Tools wurden evaluiert?
Die Arbeit evaluiert mehrere 3rd-Party-ETL-Tools, darunter Xtract IS, Palo Suite, Pentaho Data Integration und Talend Open Studio. Die Evaluierung berücksichtigt Kriterien wie Funktionalität, Benutzerfreundlichkeit, Kosten und Integrationsfähigkeit mit SAP BW.
Welches Tool wurde für die Implementierung des ETL-Prozesses ausgewählt?
Die Arbeit verwendet Palo ETL Suite für die Implementierung des ETL-Prozesses. Die Wahl des Tools wird im Kapitel 4 detailliert begründet.
Welche Programmiersprache wurde für die Prognoseberechnung verwendet?
Für die Entwicklung der Prognose-Software wurde Java verwendet.
Wie wird der Datenaustausch zwischen SAP BW und den relationalen Datenbanken realisiert?
Der Datenaustausch erfolgt über einen automatisierten ETL-Prozess, der den Export aus SAP BW, die Datenaufbereitung und den Reimport umfasst. Dabei werden geeignete SAP BW Standardschnittstellen und das ausgewählte ETL-Tool verwendet.
Welche Kapitel umfasst die Arbeit?
Die Arbeit gliedert sich in acht Kapitel: Einleitung, Grundlegende Technologien, SAP BW Standardschnittstellen, Evaluierung von 3rd-Party-ETL-Tools, Export der Daten aus SAP BW, Berechnung der Prognosen, Import der Prognosen in SAP BW und Zusammenfassung.
Wie werden die Prognosen berechnet?
Die Prognosen werden mit einer eigens entwickelten Java-Anwendung berechnet, die auf den aus dem SAP BW exportierten Daten basiert.
Welche Erweiterungsmöglichkeiten werden in der Arbeit diskutiert?
Die Arbeit diskutiert Erweiterungsmöglichkeiten wie die Implementierung eines dynamischen Exportprozesses, die Automatisierung des Reimports und ein Update des ETL-Controllers.
Welche Schlüsselwörter beschreiben die Arbeit am besten?
Schlüsselwörter sind: SAP BW, relationale Datenbanken, ETL-Prozess, Data Warehouse, Data Mining, Prognoseberechnung, Palo ETL Suite, Java, Datenextraktion, Datentransformation, Datenintegration, 3rd-Party-Tools.
- Arbeit zitieren
- Fabian Reichle (Autor:in), 2011, ETL-Prozess zum Datenaustausch zwischen SAP BW und relationalen Datenbanken, München, GRIN Verlag, https://www.grin.com/document/271192