Die Aufwandsschätzung hat einen großen Einfluss auf den Projekterfolg von IT-Projekten. Im Bereich Data Science scheitern laut mehreren Studien ca. 85% aller Projekte. Im Vergleich zu IT-Projekten liegen Data Science Projekten komplexere Fragestellungen zu Grunde. In dieser Arbeit werden Methoden zur Schätzung aus der IT-Welt vorgestellt und hinsichtlich ihres Einsatzzwecks in Data Science Projekten analysiert. Die Analyse wird anhand eines typischen Data Science Projekts unter Verwendung des CRISP-DM Modells durchgeführt. Anschließend werden die Unterschiede zwischen IT-Projekten und Data Science Projekten basierend auf eigenen Erfahrungen diskutiert. Im Ergebnis hat sich gezeigt, dass bei der Aufwandsschätzung von Data Science Projekten Erfahrungen aus vorherigen Projekten ein eine zentrale Rolle spielen. Außerdem ist eine Potenzialanalyse wichtig, um den Aufwand des Projekts gezielter einschätzen zu können.
Inhaltsverzeichnis
1 EINFÜHRUNG
2 GRUNDLAGEN
2.1 Einflussfaktoren auf den Projektaufwand
2.2 Messung der Projektproduktivität
2.3 Schätzmethoden
2.3.1 Function-Points
2.3.2 Data Points
2.3.3 Object-Points
2.3.4 Use-Case-Points
2.3.5 Story-Points
2.4 Schätzmethode und Projekttyp
3 ANALYSE
3.1 CRISP-DM
3.2 Schätzen in Data Science Projekten
4 DISKUSSION
5 ZUSAMMENFASSUNG
Zielsetzung & Themen
Die vorliegende Arbeit untersucht Methoden der Aufwandsschätzung aus der klassischen IT-Welt und deren Anwendbarkeit sowie Optimierung für komplexe Data-Science-Projekte unter Verwendung des CRISP-DM-Modells, um die hohe Fehler- und Scheiterquote in diesem Bereich zu senken.
- Analyse der Einflussparameter auf den Projektaufwand und die Produktivitätsmessung.
- Vergleichende Darstellung klassischer IT-Schätzmethoden wie Function-Points, Story-Points und Use-Case-Points.
- Integration der Aufwandsschätzung in den CRISP-DM-Prozess für Data-Science-Vorhaben.
- Diskussion über die Notwendigkeit von Potenzialanalysen und Proof-of-Concept-Projekten.
- Erfahrungswerte zur Abgrenzung zwischen klassischen IT-Projekten und agilen Data-Science-Anforderungen.
Auszug aus dem Buch
3.2 SCHÄTZEN IN DATA SCIENCE PROJEKTEN
Im Folgenden wird ein typisches Data Science Projekt anhand des CRISP-DM Standards analysiert. In diesem Zusammenhang werden mögliche Einsatzmöglichkeiten der vorgestellten Schätzmethoden herausgestellt.
Die Erwartungen und das Verständnis während Data Science Projekten passen nicht immer mit der Realität zusammen, da der Aufwand während der einzelnen Entwicklungsphasen oft falsch eingeschätzt wird [Hei19]. Viele Unternehmen wissen oft nicht, wie sie Methoden des Machine Learnings einsetzen sollen. Aus diesem Grund sollte vor einem Data Science Projekt eine Potenzialanalyse durchgeführt werden. In dieser Analyse werden zusammen mit dem Kunden Einsatzbereiche für Machine Learning untersucht. Außerdem werden dem Kunden konkrete Einsatzszenarien vorgestellt. Wenn mögliche Einsatzbereiche identifiziert sind, ist ein Proof-of-Concept Projekt sinnvoll. Ein Prototyp-Projekt hat das Ziel die Möglichkeiten und Vorteile von Machine Learning zu veranschaulichen und die Fragestellung zu validieren. Bei der Aufwandsschätzung eines Prototyp-Projekts empfiehlt sich die Schätzung auf Basis von Erfahrungen zu machen. In diesem Kontext könnte der Auftragsnehmer eine fixe Anzahl an Personentagen für die Schätzung verwenden.
Zusammenfassung der Kapitel
1 EINFÜHRUNG: Diese Einleitung erläutert die wirtschaftliche Bedeutung der Aufwandsschätzung für IT-Projekte und definiert die zentralen Forschungsfragen der Arbeit.
2 GRUNDLAGEN: Dieses Kapitel identifiziert wesentliche Einflussfaktoren auf den Projektaufwand, erläutert Methoden zur Produktivitätsmessung und stellt gängige IT-Schätzverfahren wie Function-Points und Story-Points vor.
3 ANALYSE: Hier wird der CRISP-DM Standard für Data-Science-Projekte eingeführt und untersucht, wie die zuvor vorgestellten Schätzmethoden in die einzelnen Prozessphasen integriert werden können.
4 DISKUSSION: In diesem Abschnitt werden auf Basis praktischer Erfahrungen Pro- und Contra-Argumente zur These diskutiert, ob sich die Aufwandsschätzung in Data-Science-Projekten von der in klassischen IT-Projekten unterscheidet.
5 ZUSAMMENFASSUNG: Dieses Kapitel resümiert die Notwendigkeit von Potenzialanalysen sowie Proof-of-Concept-Projekten und empfiehlt die parallele Anwendung mehrerer Schätzmethoden.
Schlüsselwörter
Aufwandsschätzung, Data Science, Projektmanagement, IT-Projekte, CRISP-DM, Potenzialanalyse, Proof-of-Concept, Softwareentwicklung, Produktivitätsmessung, Story-Points, Use-Case-Points, Projektlaufzeit, Machine Learning.
Häufig gestellte Fragen
Worum geht es in dieser Arbeit grundsätzlich?
Die Arbeit befasst sich mit der Herausforderung, den Aufwand für Data-Science-Projekte präzise zu schätzen, um die hohe Scheiterquote in diesem Bereich durch geeignete Methoden und Vorgehensweisen zu minimieren.
Welche zentralen Themenfelder werden behandelt?
Die zentralen Themen sind klassische IT-Aufwandsschätzung, das CRISP-DM-Modell als Prozessstandard, die Rolle von Prototypen in der Schätzungsphase sowie der Vergleich zwischen klassischer Softwareentwicklung und Data-Science-Vorhaben.
Was ist das primäre Ziel der Arbeit?
Das Ziel ist es, Methoden zur Aufwandsschätzung aus der IT auf Data-Science-Projekte zu adaptieren und aufzuzeigen, wie diese durch Potenzialanalysen und Proof-of-Concepts besser steuerbar gemacht werden können.
Welche wissenschaftliche Methode wird verwendet?
Die Arbeit basiert auf einer theoretischen Analyse bestehender Schätzmethoden in Kombination mit einer prozessualen Anwendung auf das CRISP-DM-Modell sowie einer diskursiven Auswertung eigener Projekterfahrungen.
Was wird im Hauptteil behandelt?
Der Hauptteil gliedert sich in eine theoretische Erörterung der Schätzmethoden (wie Function-Points, Story-Points) und eine praktische Analyse ihrer Einsetzbarkeit innerhalb des CRISP-DM-Frameworks.
Welche Schlüsselwörter charakterisieren die Arbeit?
Die Arbeit wird maßgeblich durch Begriffe wie Aufwandsschätzung, CRISP-DM, Data Science, Potenzialanalyse und Proof-of-Concept definiert.
Warum ist ein Proof-of-Concept in Data-Science-Projekten oft entscheidend?
Ein Proof-of-Concept hilft, frühzeitig Fallstricke bei komplexen Fragestellungen zu identifizieren, Erwartungen des Kunden zu validieren und das Projektrisiko zu senken, bevor eine vollständige Schätzung erfolgt.
Welche Rolle spielen Erfahrungswerte bei der Schätzung von Machine-Learning-Projekten?
Da ML-Projekte oft eine hohe Unsicherheit (Cone of Uncertainty) aufweisen, dienen Erfahrungswerte aus früheren Projekten als kritische Basis, um den Aufwand für Modellierungen oder Data-Cleansing-Aufgaben realistischer einzuschätzen.
- Arbeit zitieren
- Janik Tinz (Autor:in), 2021, Aufwandsschätzung in Data Science Projekten, München, GRIN Verlag, https://www.grin.com/document/1041312