Die SAP HANA – Express Edition ist eine kostenlose Möglichkeit, SAP HANA in eingeschränktem Umfang zu verwenden. SAP verspricht einen großen Funktionsumfang und eine hohe Performanz innerhalb der Datenverarbeitung und bei der Analyse, was den Bereich von Predictive Analytics miteinschließt. Die Dokumentation rund um das System ist sehr ausführlich, jedoch gibt es keine Quelle, die darüber informiert, inwiefern sich die SAP HANA Express – Edition in der Lehre anhand ausgewählter Kriterien verwenden lässt. In der vorliegenden Arbeit wird die Verwendbarkeit des Systems anhand verschiedener Kriterien aus der Lehre sowie durch Laufzeitmessungen erforscht. Um das System zu bewerten, wurde neben einigen Installations- und Konfigurations-schritten, die Anwendung von Algorithmen aus dem Bereich Predictive Analytics durchgeführt. Dabei wurde auf die notwendige Einarbeitung, die auftretende Komplexität, die Möglichkeiten innerhalb des Systems sowie auf Beschränkungen geachtet. Weiterhin wurden durch explizite Laufzeittests verschiedene Erkenntnisse ermittelt. Es kam unter anderem heraus, dass die Einarbeitung einiger Informationstechnologischer Vorerfahrung bedarf, die Komplexität durch Alternativpfade und Objekt-Zusammenhänge gekennzeichnet ist, die Möglichkeiten hinsichtlich des Handlings und des Funktionsumfangs sehr weitläufig sind und es Einschränkungen bei der Transparenz von Fehlersuchen gibt. Die Laufzeitmessungen zeigen, wie sich die Auslagerung des Front-Ends auf die Performanz auswirkt, wie sich das System bei der Verarbeitung von 150 Datensätzen schrittweise bis zu einer Million Datensätze verhält und wo die Grenzen der Hardware liegen. Die SAP HANA – Express Edition ist ein sehr geeignetes System für den Einsatz in der fortgeschrittenen Lehre der Datenverarbeitung.
Inhaltsverzeichnis
- Abstract
- Inhaltsverzeichnis
- 1 Einleitung
- 1.1 Motivation und Ziel dieser Arbeit
- 1.2 Aufbau der Arbeit
- 2 Überblick SAP HANA
- 2.1 Historie von SAP HANA
- 2.2 Architektonische Merkmale
- 2.3 SAP HANA Express-Edition
- 2.3.1 Datenauswertungsfunktionalität
- 2.3.2 Application Function Library (AFL)
- 2.3.3 Predictive Analysis Library (PAL)
- 2.3.4 Application Function Modeler (AFM)
- 3 Demo – Reporting und Datenaufbereitung mit SAP HANA -Express Edition
- 3.1 Umgebung und Einrichtung der Systeme
- 3.1.1 Installation von SAP HANA Express-Edition
- 3.1.2 Test der Installation
- 3.1.3 Konfiguration von SAP HANA Tools für Eclipse
- 3.1.4 Einbindung der Datenbank und Konfiguration
- 3.2 Datengrundlage
- 3.3 Versuch Algorithmen und Datenauswertung
- 3.3.1 PAL: Time-Series Analysis Auto Arima und Arima Forecast
- 3.3.2 PAL: K-Means Clustering
- 3.1 Umgebung und Einrichtung der Systeme
- 4 Lessons Learned
- 4.1 Einarbeitung
- 4.2 Komplexität
- 4.3 Möglichkeiten
- 4.4 Einschränkungen
- 4.5 Laufzeitbeobachtungen
- 4.5.1 Rechnerkapazitätsauslastung
- 4.5.2 Vergleich von lokaler und verteilter Architektur
- 4.5.3 Laufzeitmessungen bei unterschiedlich großen Datenmengen
- 4.6 Ergebnisse der Laufzeitmessungen und Interpretation
- 5 Fazit
- 5.1 Zusammenfassung
- 5.2 Beantwortung der Forschungsfrage
- 5.3 Erschaffener Mehrwert
- 5.4 Limitationen
- 5.5 Weitere Forschung
- Literaturverzeichnis
- A. [Anhang]
- 6 Inhalt Anhang
- 6.1 AFM JOIN Operation Business Case BRAVO
- 6.1.1 Snowflake-Schema
- 6.1.2 Datenimport und Aufbereitung
- 6.1.3 Datenverbindung
- 6.2 Details zu den Laufzeitmessungen
- 6.3 Zugriffsrecht-Management
- 6.1 AFM JOIN Operation Business Case BRAVO
- 6 Inhalt Anhang
- 7 Danksagung
Zielsetzung und Themenschwerpunkte
Diese Arbeit untersucht die Eignung der SAP HANA Express Edition für den Einsatz in der Hochschullehre im Bereich der Datenverarbeitung, insbesondere im Kontext von Predictive Analytics. Es werden die Verwendbarkeit und Performance der Software anhand ausgewählter Kriterien evaluiert.
- Verwendbarkeit der SAP HANA Express Edition in der Lehre
- Komplexität der Systembedienung und Datenverarbeitung
- Möglichkeiten und Limitationen der Software für Predictive Analytics
- Performance-Analyse unter realistischen Hardwarebedingungen
- Evaluation von Algorithmen aus der Predictive Analysis Library (PAL)
Zusammenfassung der Kapitel
1 Einleitung: Die Einleitung führt in die Thematik der Datenanalyse und Predictive Analytics ein und begründet die Relevanz von SAP HANA im Kontext der Digitalisierung. Sie beschreibt die Motivation und Zielsetzung der Arbeit sowie die Forschungsfragen, die im Laufe der Arbeit beantwortet werden sollen: die Eignung der SAP HANA Express Edition für die Lehre und ihre Performanz bei der Verarbeitung von Daten im Bereich Predictive Analytics.
2 Überblick SAP HANA: Dieses Kapitel bietet einen umfassenden Überblick über die SAP HANA Datenbank, ihre Architektur, ihre Historie und die Funktionsweise der In-Memory-Technologie. Es erläutert die Architekturmerkmale von SAP HANA, einschließlich der Index-Server, des Name-Servers, und der verschiedenen Funktionsbibliotheken wie der Predictive Analysis Library (PAL) und der Application Function Library (AFL). Die SAP HANA Express Edition wird als kostenfreie, eingeschränkte Version vorgestellt.
3 Demo – Reporting und Datenaufbereitung mit SAP HANA -Express Edition: Dieses Kapitel beschreibt einen praktischen Anwendungsfall, der die Schritte von der Installation und Konfiguration der SAP HANA Express Edition bis hin zur Anwendung von Predictive Analytics Algorithmen (Auto-Arima, Arima Forecast und K-Means) detailliert beschreibt. Es dokumentiert die Einrichtung der Entwicklungsumgebung, den Import von Daten, die Verwendung des Application Function Modeler (AFM) und die Interpretation der Ergebnisse. Die Kapitel beschreibt ebenfalls die Systemumgebung, welche für die Laufzeitmessungen verwendet wurde.
4 Lessons Learned: Dieses Kapitel fasst die Erfahrungen und Erkenntnisse aus der praktischen Arbeit mit der SAP HANA Express Edition zusammen. Es bewertet die Software anhand der Kriterien Einarbeitung, Komplexität, Möglichkeiten und Einschränkungen. Die Ergebnisse der Laufzeitmessungen werden analysiert und interpretiert, sowohl im Vergleich zwischen lokaler und verteilter Architektur als auch hinsichtlich des Einflusses der Datenmenge auf die Performance.
Schlüsselwörter
SAP HANA Express Edition, Predictive Analytics, Datenanalyse, In-Memory Datenbank, PAL (Predictive Analysis Library), AFM (Application Function Modeler), Laufzeitmessung, Hochschullehre, Datenverarbeitung, Komplexität, Performance, Algorithmen (Auto-Arima, Arima Forecast, K-Means), Datenaufbereitung, Systemumgebung
Häufig gestellte Fragen (FAQ) zu "SAP HANA Express Edition in der Hochschullehre"
Was ist der Gegenstand dieser Arbeit?
Diese Arbeit untersucht die Eignung der SAP HANA Express Edition für den Einsatz in der Hochschullehre im Bereich der Datenverarbeitung, insbesondere im Kontext von Predictive Analytics. Die Verwendbarkeit und Performance der Software werden anhand ausgewählter Kriterien evaluiert.
Welche Themen werden behandelt?
Die Arbeit behandelt die Verwendbarkeit von SAP HANA Express Edition in der Lehre, die Komplexität der Systembedienung und Datenverarbeitung, die Möglichkeiten und Limitationen der Software für Predictive Analytics, eine Performance-Analyse unter realistischen Hardwarebedingungen und die Evaluation von Algorithmen aus der Predictive Analysis Library (PAL).
Welche Kapitel umfasst die Arbeit?
Die Arbeit gliedert sich in eine Einleitung, einen Überblick über SAP HANA (inklusive der Express Edition und ihrer Funktionsbibliotheken wie PAL und AFL), eine praktische Demonstration von Reporting und Datenaufbereitung mit SAP HANA Express Edition (inkl. Installation, Datenimport und Anwendung von Algorithmen wie Auto-Arima, Arima Forecast und K-Means), eine Zusammenfassung der gewonnenen Erkenntnisse ("Lessons Learned" mit Laufzeitmessungen und deren Interpretation), sowie ein Fazit mit Zusammenfassung, Beantwortung der Forschungsfrage, Bewertung des Mehrwerts, Limitationen und Ausblick auf weitere Forschung. Ein Anhang enthält zusätzliche Informationen, z.B. zu einem Business Case und Details zu den Laufzeitmessungen.
Welche Algorithmen werden in der praktischen Demonstration verwendet?
In der praktischen Demonstration werden die Algorithmen Auto-Arima, Arima Forecast (beide zur Zeitreihenanalyse) und K-Means Clustering aus der Predictive Analysis Library (PAL) von SAP HANA eingesetzt.
Welche Aspekte der Performance werden untersucht?
Die Performance-Analyse umfasst die Rechnerkapazitätsauslastung, einen Vergleich zwischen lokaler und verteilter Architektur und Laufzeitmessungen bei unterschiedlich großen Datenmengen.
Welche Software und Tools werden verwendet?
Die Arbeit konzentriert sich auf die SAP HANA Express Edition, SAP HANA Tools für Eclipse und den Application Function Modeler (AFM).
Welche Forschungsfragen werden beantwortet?
Die zentralen Forschungsfragen sind die Eignung der SAP HANA Express Edition für die Lehre und ihre Performanz bei der Verarbeitung von Daten im Bereich Predictive Analytics.
Welche Schlussfolgerungen werden gezogen?
Das Fazit fasst die Ergebnisse zusammen, beantwortet die Forschungsfrage zur Eignung und Performanz von SAP HANA Express Edition, bewertet den erstellten Mehrwert und benennt Limitationen der Studie. Es gibt auch einen Ausblick auf zukünftige Forschungsarbeiten.
Wo finde ich weitere Details zu den Laufzeitmessungen?
Detaillierte Informationen zu den Laufzeitmessungen finden sich im Anhang der Arbeit.
Welche Schlüsselwörter beschreiben die Arbeit?
Schlüsselwörter sind: SAP HANA Express Edition, Predictive Analytics, Datenanalyse, In-Memory Datenbank, PAL (Predictive Analysis Library), AFM (Application Function Modeler), Laufzeitmessung, Hochschullehre, Datenverarbeitung, Komplexität, Performance, Algorithmen (Auto-Arima, Arima Forecast, K-Means), Datenaufbereitung, Systemumgebung.
- Quote paper
- Julius Dold (Author), 2020, Predictive Analytics Lösungen für Datenauswertungen mit SAP HANA Express-Edition im Hochschulbetrieb, Munich, GRIN Verlag, https://www.grin.com/document/961362