Das größte Problem mit dem sich alle Erzeuger-EVUs beschäftigen müssen, ist die Einsatzplanung der zur Verfügung stehenden Kraftwerke und die Einhaltung der mit Verbundnetzen abgeschlossenen Verträge, so daß sich ein Kostenoptimum für jeden einzelnen Tag und in der Jahresbilanz ergibt.
Vorliegende Arbeit beschäftigt sich mit der Analyse und Auswertung verschiedener Prognosesysteme im Kontext der Energiebedarfsplanung der Stadt Bremen und zeigt deren Stärken und Schwächen auf.
Inhaltsverzeichnis
Eidesstattliche Erklärung
Beschreibung der Themenstellung
Abbildungsverzeichnis
Tabellen-/Gleichungsverzeichnis
Vorwort
1 Einleitung
2 Analyse
2.1 Einführung
2.2 Datenverarbeitung mittels SPSS für Windows
2.3 Das Datenmaterial
2.3.1 Aufbereitung des Datenmaterials zur Analyse
2.3.2 Korrektur des inkonsistenten Datenmaterials
2.3.3 Charakteristische Datenaufteilung
2.3.4 Charakteristiken
2.3.4.1 Verteilungen
2.4 Zeitreihen
2.4.1 Stationarität der Zeitreihe
2.4.2 Spektralanalyse
2.4.3 Empirische Momente 1. und 2. Ordnung der Zeitreihe
2.4.4 Zusammenhangsanalyse
2.4.4.1 Streudiagramme (Scatterplots)
2.4.4.2 Korrelogramme
3 Prognoseverfahren/-modelle
3.1 Beurteilungsmethoden für die Prognosequalität
3.1.1 Ex-ante-Beurteilung
3.1.2 Ex-post-Beurteilung
3.2 Univariate Prognoseverfahren
3.2.1 Die naive Prognose
3.2.2 Prognose durch gleitenden Durchschnitt
3.2.3 Exponentielle Glättung
3.3 Multivariate Prognoseverfahren
3.3.1 Multiple Regressionsanalyse
3.3.2 Adaptive Filtersysteme
3.4 Heuristische Prognoseverfahren
4 Zusammenfassung
Literaturliste
Anhang A
Anhang B
Eidesstattliche Erklärung
Hiermit versichere ich, daß ich die vorliegende Diplomarbeit selbständig und nur unter Verwendung der angegebenen Literatur angefertigt habe.
Bremen, den
Abbildung in dieser Leseprobe nicht enthalten
Beschreibung der Themenstellung
Anhand bekannter mathematischer Prognoseverfahren (statistische Verfahren, Zeitreihenanalyse) sollen die elektrischen Energieverbrauchsdaten der Stadt Bremen möglichst genau im voraus bestimmt werden, so daß der Kraftwerkseinsatz besser koordiniert werden kann. Dabei sollen die Einflußgrößen wie Jahreszeit, Wetter, und soziale Gewohnheiten detailiert analysiert und als Parameter in die Prognose mit einbezogen werden.
Abbildungsverzeichnis
Abbildung 2.1: Histogramm zur Netto-Erzeugerleistung im Gesamtzeitraum
Abbildung 2.2: Histogramm zur Netto-Erzeugerleistung an Wochentagen ohne Feiertage
Abbildung 2.3: Histogramm zur Netto-Erzeugerleistung an Wochenenden und Feiertagen
Abbildung 2.4: Balkendiagramm Leistungsstufen Gesamtzeitraum
Abbildung 2.5: Relative Leistungsstufenverteilung im Gesamtzeitraum
Abbildung 2.6: Relative Leistungsstufenverteilung an ferienfreien Tagen
Abbildung 2.7: Relative Leistungsstufenverteilung im Bereich JA £ 0°C
Abbildung 2.8: Relative Leistungsstufenverteilung im Bereich 0°C £ JA £ 20°C
Abbildung 2.9: Relative Leistungsstufenverteilung im Bereich JA ³ 20°C
Abbildung 2.10: Temperaturverteilung ohne Wochenenden und Feiertage
Abbildung 2.11: Relative Leistungsstufenverteilung auf Temperaturbereiche
Abbildung 2.12: Systemdynamik Jan. ‘95 bis Dez. ‘96
Abbildung 2.13: Schwankung um Mittelwert
Abbildung 2.14: Schwankungsintervall
Abbildung 2.15: Verlauf der 19:00 Uhr-Werte über den Gesamtanlysezeitraum
Abbildung 2.16: Histogramm zur halbstündigen Laständerung
Abbildung 2.17: Histogramm zur stündlichen Laständerung
Abbildung 2.18: Verteilung der Laständerung bei ïDP/h ï ³ 50 MW/h auf den Tag
Abbildung 2.19: Verteilung der Laständerung bei DP/h ³ +50 MW/h auf den Tag
Abbildung 2.20: Verteilung der Laständerung bei DP/h £ -50 MW/h auf den Tag
Abbildung 2.21: DP/h ³ +50 MW/h im Bereich 600 bis 800 Uhr
Abbildung 2.22: DP/h £ –50 MW/h im Bereich 2330 bis 0130 Uhr
Abbildung 2.23: DP/h £ –50 MW/h im Bereich 1400 bis 1430 Uhr
Abbildung 2.24: DP/h £ –50 MW/h im Bereich 2030 bis 2200 Uhr
Abbildung 2.25: Integrierte Leistungswerte
Abbildung 2.26: Spektraldichte der mittleren Tagesleistung
Abbildung 2.27: Spektraldichte der Halbstunden-Leistungswerte
Abbildung 2.28: Spektraldichte der mittleren Tagesleistung ohne Wochenenden
Abbildung 2.29: Charakteristischer Verlauf der mittleren Tagesleistungen
Abbildung 2.30: Scatterplot Leistung–Außentemperatur
Abbildung 2.31: Scatterplot Leistung–Windgeschwindigkeit
Abbildung 2.32: Scatterplot Leistungsbedarf–Windrichtung
Abbildung 2.33: Scatterplot Leistung–Luftfeuchtigkeit
Abbildung 2.34: Scatterplot Außentemperatur–Luftfeuchtigkeit
Abbildung 2.35: Scatterplot Außentemperatur–Windrichtung
Abbildung 2.36: Scatterplot Außentemperatur–Windgeschwindigkeit
Abbildung 2.37: Scatterplot Luftfeuchtigkeit–Windgeschwindigkeit
Abbildung 2.38: Korrelogramm Leistung–Außentemperatur
Abbildung 2.39: Korrelogramm Leistung–Windgeschwindigkeit
Abbildung 2.40: Korrelogramm Leistung–Luftfeuchtigkeit
Abbildung 2.41: (Auto-) Korrelogramm der Erzeugerleistung bis » 7 Tage
Abbildung 2.42: (Auto-) Korrelogramm der Erzeugerleistung bis 24 Stunden
Abbildung 3.1: Abweichungsmittelwert der naiven Prognose
Abbildung 3.2: Mittelwert des Abweichungsbetrages der naiven Prognose
Abbildung 3.3: Naive Prognose
Abbildung 3.4: Verlauf des mittleren Prognosefehlers über Gesamtzeitraum
Abbildung 3.5: Verteilung des Prognosefehlers
Abbildung 3.6: Tagesverteilung der Prognosefehler > 10%
Abbildung 3.7: Prognose mit Feiertagen
Abbildung 3.8: Prognose ohne Feiertage
Abbildung 3.9: Mittlere absolute Abweichung als Funktion von a
Abbildung 3.10: Abweichungsmittelwert der exponentiellen Glättung (Stunde zu Stunde)
Abbildung 3.11: WMQA-Wert als Funktion von a
Abbildung 3.12: Abweichungsmittelwert der exponentiellen Glättung (Tag zu Tag/ mit Feiertag)
Abbildung 3.13: Abweichungsmittelwert der exponentiellen Glättung (Tag zu Tag/ ohne Feiertag)
Abbildung 3.14: Scatterplot Leistung-Außentemperatur (Tagesmittelwerte)
Abbildung 3.15: Prognose durch lineare Einfachregression
Abbildung A 1: Leistungsverteilung an Montagen
Abbildung A 2: Leistungsverteilung an Dienstagen
Abbildung A 3: Leistungsverteilung an Mittwochen
Abbildung A 4: Leistungsverteilung an Donnerstagen
Abbildung A 5: Leistungsverteilung an Freitagen
Abbildung A 6: Leistungsverteilung an Samstagen
Abbildung A 7: Leistungsverteilung an Sonntagen
Abbildung A 8: Leistungsmittelwerte sortiert nach Wochentagen im Gesamtzeitraum
Abbildung A 9: Verlauf der 11:30 Uhr-Werte über den Gesamtanlysezeitraum
Abbildung A 10: Verlauf der 17:30 Uhr-Werte über den Gesamtanlysezeitraum
Abbildung A 11: Verlauf der 19:30 Uhr-Werte über den Gesamtanlysezeitraum
Abbildung A 12: DP/h ³ +50 MW/h im Bereich 600 bis 800 Uhr ( Ferienbetrachtung )
Abbildung A 13: Korellogramm Außentemperatur–Windgeschwindigkeit
Abbildung A 14: Korrelogramm Außentemperatur–Windrichtung
Abbildung A 15: Korrelogramm Außentemperatur–Luftfeuchtigkeit
Tabellen-/Gleichungsverzeichnis
Tabellen
Tabelle 2.1: Kraftwerkseigenleistungen
Tabelle 2.2: Temperaturklassifikation
Tabelle 2.3: Empirische Momente
Tabelle 2.4: Kreuzkorrelationskoeffizienten
Tabelle 3.1: Prognose mit Feiertagen (Fehlerkenngrößen)
Tabelle 3.2: Prognose ohne Feiertage (Fehlerkenngrößen)
Tabelle 3.3
Gleichungen
Gl. 2.1: Arithmetischer Mittelwert
Gl. 2.2: Varianz
Gl. 2.3: Standardabweichung
Gl. 2.4: Empirische Kovarianz
Gl. 2.5: Empirischer Korrelationskoeffizient
Gl. 2.6: Korrelationskoeffizient von Bravais-Pearson
Gl. 2.7: Kreuzkorrelationskoeffizient von Bravais-Pearson
Gl. 2.8: Zeitverschiebung (Time-Lag)
Gl. 2.9: Autokovarianzfunktion
Gl. 2.10: Autokorrelationsfunktion (AKF)
Gl. 3.1: Prognosefehler:
Gl. 3.2: Absoluter Prognosefehler:
Gl. 3.3: Quadratischer Prognosefehler:
Gl. 3.4: Relativer absoluter Prognosefehler:
Gl. 3.5: Mittlere absolute Abweichung (MAA):
Gl. 3.6: Mittlere quadratische Abweichung (MQA):
Gl. 3.7: Wurzel aus der mittleren quadratischen Abweichung (WMQA):
Gl. 3.8: Ungleichheitskoeffizient von Theil (U):
Gl. 3.9: Konstantes Modell der exponentiellen Glättung
Gl. 3.10: Lineare Einfachregression
Vorwort
Die Stadtwerke Bremen AG - mittlerweile 143 Jahre alt - versorgt die Stadt Bremen seit vielen Jahren neben Gas, Trinkwasser und Fernwärme auch mit elektrischer Energie (Strom). Dabei sind die drei Kriterien der Wirtschaftlichkeit, des Umweltschutzes und der Versorgungssicherheit von essentieller Bedeutung für den Erfolg und die Leistungsfähigkeit des Unternehmens und deshalb auch die festgeschriebenen Unternehmensziele.
Für die Versorgungssicherheit ist vor allem präzise gewartetes Equipment, gut geschultes und stets einsatzbereites Personal von Wichtigkeit. Durch den Einsatz modernster und ökonomischer Technik, Kontrolle sämtlicher Emissionswerte der Kraftwerke und die Durchführung erforderlicher Korrekturmaßnahmen können auf dem Gebiet des Umweltschutzes große Erfolge erzielt werden. Die Wirtschaftlichkeit des Unternehmens wird dadurch erreicht, daß die Preise für Strom, Wasser, Gas und Wärme einerseits kundenfreundlich, andererseits aber auch so bemessen sind, daß wichtige Investitionen für die Zukunft und die Betriebsbereitschaft sämtlicher Anlagen getätigt werden können.
Anders als andere Unternehmen, deren Umsatz im wesentlichen vom Angebots/Nachfrage-Verhältnis der erzeugten Produkte abhängt, ist die Stadtwerke Bremen AG –so wie andere EVU auch– dazu verpflichtet, dem Verbraucher ihr Produkt (Energie und Trinkwasser) in ausreichender Menge zur Verfügung zu stellen und zwar rund um die Uhr. Das Angebot kann hier nicht alleine dadurch geregelt werden, daß die Nachfrage beobachtet wird, sondern es muß –wenn möglich– genau bekannt sein, wie der Verlauf der Nachfrage in der Zukunft aussehen wird. Auf unterschätzten Bedarf kann ein Erzeuger-EVU nämlcih nur allzu träge reagieren und ein Überangebot ist mit großen finanziellen Verlusten verbunden, da nach heutigem Stand der Technik eine ökologische wie auch ökonomische Energiespeicherung in großem Maße nicht vollzogen werden kann.
Die Prognose des Energiebedarfs der Stadt Bremen ist also eine für die Wirtschaftlichkeit des Unternehmens Stadtwerke Bremen AG eine sehr wichtige, aber auch sehr komplexe und komplizierte Angelegenheit. Derzeit wird die für die tägliche Kraftwerkseinsatzplanung erforderliche Tageslastgangkurve per Hand von Mitarbeitern des Lastverteilers angefertigt und hat mit ca 95% eine sehr hohe Vorhersagequalität. Dabei ist die Prognose natürlich stark von der sie anfertigenden Person abhängig; Faktoren wie die langjährige Erfahrung des betreffenden Mitarbeiters und die subjektive Bewertung des Witterungseinflußes bestimmen maßgeblich die Qualität der Vorhersage.
Um den Mitarbeitern die Aufgabe der Tageslastprognose - wenn auch nicht abzunehmen - wenigstens zu vereinfachen, soll mit der vorliegenden Diplomarbeit die grundlegende Untersuchung gemacht werden, ob und mit welchen Mitteln ein automatisiertes Prognosesystem erstellt und eingesetzt werden kann und welche Vorraussetzungen dafür gelten müssen. Die Qualität der durch das System gemachten Prognosen muß natürlich mindestens die der Mitarbeiter erreichen, da erst dann an einen Einsatz im täglichen Betrieb des Lastverteilers denkbar und sinnvoll ist.
Ich möchte mich hiermit bei allen direkt und indirekt beteiligten Personen, innerhalb, wie außerhalb der Stadtwerke Bremen AG bedanken, speziell jedoch bei dem Abteilungsleiter des Lastverteilers und dessen zugehörigen Stellen, Herrn Andre Becker, der die Bearbeitung dieser Diplomarbeit durch meine Person erst möglich gemacht hat und mir stets mit Rat und Tat zur Seite stand.
Ganz spezieller Dank gilt auch meinem betreuenden Dozenten, Herrn Prof. Dr. Rausnitz, der ebenfalls großen Einfluß auf die Realisation der vorliegenden Diplomarbeit gehabt, und mich während der Bearbeitungsphase –vielleicht unwissentlich– motiviert hat weiterzumachen.
1 Einleitung
Die Versorgung der Stadt Bremen mit elektrischer Energie erfolgt zu 90% durch die Stadtwerke Bremen AG, die restlichen 10% werden –vertraglich festgeschrieben– von der Preußen Elektra AG geliefert. Insgesamt werden jährlich rund 3,4 Mrd kWh elektrischer Energie in der Stadt Bremen benötigt, wobei jedoch in etwa ein Drittel dieser Energiemenge alleine von den Stahlwerken Bremen konsumiert werden.
Die Erzeugung der elektrischen Energie erfolgt –einsatzoptimiert– durch die Verbrennung von Steinkohle oder Erdgas, oder durch den Einsatz von sog. Gasturbinen, die durch die bei der Verbrennung von leichtem Heizöl entstehenden Abgase angetrieben werden.
Bei der Stahlschmelze in den Hochöfen der Stahlwerke Bremen entsteht bei der Gewinnung reinen Eisens (durch Reduktion des Eisenerzes) sog. Gichtgas (etwa 60 Vol% N2, 30 Vol% CO und 10 Vol% CO2), welches für die Erzeugung elektrischer Energie einen noch genügend hohen Brennwert hat. Die im Gichtgas steckende Energie wird mittels 16 2/3 Herz-Generatoren in elektrische Energie umgewandelt und direkt in das Netz der Bahn AG eingespeist. Seit Herbst 1995 steht auf dem Gelände des Kraftwerks Mittelsbühren ein statischer Umrichter, der es ermöglicht, den 16 2/3 Hz-Einphasenwechselstrom der Bahn, in 50 Hz-Drehstrom, wie er an Haushalte und Industrie geliefert wird, zu konvertieren und umgekehrt. Damit ist es nun möglich, bei Minderbedarf der Bahn AG, z.B. an Wochenenden, die überschüßige Energie in das Stadtnetz Bremen einzuspeisen, anstatt sie einfach verpuffen zu lassen[1].
Das größte Problem mit dem sich alle Erzeuger-EVUs beschäftigen müssen, ist die Einsatzplanung der zur Verfügung stehenden Kraftwerke und die Einhaltung der mit Verbundnetzen abgeschlossenen Verträge, so daß sich ein Kostenoptimum für jeden einzelnen Tag und in der Jahresbilanz ergibt.
Dieses Optimum ist dabei von vielen Faktoren abhängig, von denen hier nur einige erwähnt werden sollen:
- welche Leistung wird benötigt,
- wann wird die Leistung benötigt,
- wie lange muß die Leistung bereitgestellt werden,
- welches Kraftwerk hat welche Betriebskosten,
- wie hängen die Betriebskosten eines KWs von dessen Auslastung ab,
- welche Anfahrzeit hat welches Kraftwerk,
- was kostet das Anfahren des Kraftwerks,
- welche Kraftwerke sind überhaupt einsatzbereit,
- müssen Verträge mit Fremdversorgern eingehalten werden,
- wann kann die Fremdenergie am kostengünstigsten abgenommen werden...?
Selbst bei der Annahme, daß oben erwähnte Punkte zu Genüge bekannt und in allen denkbaren Kombinationen durchkalkuliert wurden, so ist die Qualität der Optimierung immer noch stark von der Vorhersage des Energiebedarfs des zu versorgenden Gebietes abhängig.
Und hier liegt auch die größte Schwierigkeit, denn der Energieverbrauch einer Stadt wie Bremen ist letztlich nicht nur von der Zeit und vielen weiteren kausalen Einflüssen abhängig, sondern unterliegt auch gewissen stochastischen Schwankungen, deren Bestimmung (Schätzung) in das Gebiet der Wahrscheinlichkeitstheorie und Statistik fällt, und somit –allen gestellten Erwartungen zum Trotz– niemals 100% ig vollzogen werden kann. Vielmehr ist die genaue Vorhersage eines zufälligen Prozesses wiederum ein zufälliges Ereignis, was sich zwar wiederholen kann, aber nicht muß.
Bei der Erstellung eines Prognosesystems stellt sich zunächst einmal die Frage, welche Arten von angewandten Prognoseverfahren sind bereits bei anderen EVUs im Einsatz, bzw. welche Verfahren sind überhaupt geläufig. Das nächste Problem ist die Auswahl eines adäquaten Prognosemodells aus der Vielzahl gängiger Methoden.
Die Komplexität der verschiedenen Prognoseverfahren und die schlechte Interpretierbarkeit der aus Untersuchungen vorliegenden Ergebnisse, erschweren die Auswahl eines geeigneten Verfahrens, da die ex-ante Beurteilung der Prognosequalität in ihrer Wertigkeit stets davon abhängig ist, welche Art der Beurteilung angewandt wird. So gibt es eigentlich zu jedem Prognoseverfahren eine Bewertungscharakteristik, die dem untersuchten Verfahren eine gewisse Existenzgrundlage gibt. So kann die niedrige quantitative Vorhersagegenauigkeit eines getesteten Verfahrens durch dessen einfache Implementierung, zu einem insgesamt befriedigenden Ergebnis gebracht werden.
Die erwähnte Komplexität der Prognoseverfahren läßt eine empirische Ermittlung des günstigsten Verfahrens nicht zu, da die Anwendung jedes dieser Verfahren –sofern es sich nicht um einfache autoregressive Prognosemodelle, wie beispielsweise die exponentielle Glättung oder simple Berechnung gleitender Durchschnitte handelt– mit hohem Aufwand verbunden ist.
Durch die Betrachtung des zu prognostizierenden Systems mit all seinen Komponenten und die genaue Analyse der äußeren Einflußfaktoren, erhält man einen Überblick über die Komplexität des am besten geeigneten Prognoseverfahrens und kommt dadurch automatisch zu einer Vorabselektion aller in Frage kommenden Modelle. Anschließend braucht man sich dann nur noch für eines dieser Modelle zu entscheide, welches dann auf die gegebenen Umstände anpzuassen ist. Der Ausdruck „nur“ ist dabei mit äußerster Vorsicht zu genießen, da es auch nach vielen Jahren der Anwendung etwaiger Prognoseverfahren noch immer keines gibt, welches dem Anspruch der idealen Prognose gewachsen ist.
2 Analyse
2.1 Einführung
Bevor eine Entscheidung für ein bestimmtes Prognosesystem getroffen werden kann oder sollte, bietet es sich an, eine eingehende Analyse des zur Prognose bereitstehenden Datenmaterials zu erwägen.
Der Nutzen dieser Datenanalyse liegt auf der Hand; so ist es für den hier betrachteten Fall der Tageslastprognose von essentieller Bedeutung, ob sich beispielsweise alle Tage gleich verhalten oder unterschiedliche Tagescharakteristiken bestehen. Das Ergebnis dieser Analyse zeigt dann, ob das anzuwendende Prognoseverfahren entlang der Zeitreihe eingesetzt werden kann oder sollte, oder ob eine Prognose quer durch die Zeitreihe, also entlang den verschiedenen Wochentagen[2] von Nöten ist.
Die Analyse gibt aber auch Auskunft über den Zusammenhang zwischen abhängigen und unabhängigen Variablen, so daß von vornherein eine Entscheidung über die Notwendigkeit der Berücksichtigung etwaiger Fremdeinflüsse getroffen werden kann. Für jede vermeintliche Einflußgröße, die sich durch die Analyse als nicht signifikant erweist, nimmt der Implementierungsaufwand des Prognosesystems stark ab, wohingegen die Einberechnung dieser Faktoren keine großen Verbesserungen hinsichtlich der Prognosequalität mit sich bringt.
Anmerkung: Die hier dargestellten Grafiken sind nur eine Auswahl einer großen Anzahl der Analysen, die bei der Datenbetrachtung gemacht wurden, und eine sehr kleine Auswahl derer Untersuchungen, die prinzipiell hätten gemacht werden können. Es ist als Statistik-Einsteiger und Neuling auf dem Gebiet der elektrischen Energieversorgung äußerst schwierig, eine Auswahl adäquater Untersuchungen zu treffen, so daß sehr viele Untersuchungen (ca. 80%) nicht die erwarteten Ergebnisse geliefert haben und deshalb sofort ad acta gelegt wurden. Es gibt aber auch keine Leitregeln zur spezifischen Datenanalyse, weshalb die Kreativität des Analytikers ganz besonders gefragt ist.
Die Ideen zu den meisten der beschriebenen Analysen ergaben sich spontan während der Bearbeitung oder aus der Auswertung bereits durchgeführter Untersuchungen, oder bei sonstigen Datenbearbeitungen, wie zum Beispiel der Datenkorrektur. Aus diesem Grunde ist auch eine strikte Trennung der Analyse von anderen in dieser Arbeit abgehandelten Kapiteln nicht möglich und sicherlich auch nicht sinnvoll, so daß der Leser auch an anderer Stelle Datenanalysen finden wird, die in diesem Kapitel hätten abgehandelt werden können.
2.2 Datenverarbeitung mittels SPSS für Windows
Das Programmsystem SPSS für Windows ist ein Statistikprogramm, welches sich aus dem Basismodul und verschiedenen Einzelmodulen zusammensetzt. Das Basismodul stellt dabei zunächst nur die "einfachen" deskriptiven und explorativen Datenanalyseverfahren zur Verfügung; weitergehende Untersuchungen wie die Multiple Regressionsanalyse oder die Spektralanalyse sind nur mit speziellen Erweiterungsmodulen möglich, die einzeln oder im Bundle erworben werden können.
Die zusätzlichen Module sind im einzelnen
- SPSS Professional Statistics™
- SPSS Advanced Statistics™
- SPSS Tables™
- SPSS Trends™
- SPSS Categories™
- SPSS CHAID™
- SPSS LISREL® 7
wobei hier nicht auf deren Inhalt und Funktionen weiter eingegangen werden soll.
Der Umgang mit SPSS geht nach einer ersten Eingewöhnungsphase recht leicht von der Hand und läßt dem Benutzer viel Spielraum im funktionellen Umgang mit den zu analysierenden Daten, allerdings nur bezogen auf vollständige Zeitreihen oder Merkmale und nicht auf einzelne Fälle (SPSS-Bezeichnung für jeden zusammengehörigen Datensatz). Das Programmsystem eignet sich sowohl für die rein statistische Datenanalyse und die Verwaltung der zugehörigen Daten, als auch für die Untersuchung von Zeitreihen, so wie sie hier gemacht wurde.
Während der Arbeit mit SPSS stellte sich heraus, daß das Programm zwar –im Gegensatz zu MS Excel– in der Lage ist, die anfallende Datenflut (>35.000 Datensätze bei 2 Jahren Analysezeitraum) zu beherrschen, jedoch große Systemresourcen von Nöten sind; ein 80486‑Rechner mit 8MB Arbeitsspeicher war bei vielen Aktionen zu langsam. So kam es sehr häufig zu Programm- oder gar Systemabstürzen, aufgrund mangelnden Arbeitsspeichers, wodurch viele aufwendige Analysen wiederholt werden mußten.
Ein großes Manko des Programmsystems SPSS ist auch die Einschränkung im Umgang mit den häufig verwendeten Charts; die einzige Möglichkeit die bearbeiteten Grafiken in eine verwendete Textverarbeitung einzufügen, ist der Umweg über die Windows-Zwischenablage. Dies ist besonders bei Analysen des gesamten Datenmaterials sehr zeitintensiv (Spitzenwert 15 Minuten) und bedarf eines großen Arbeitsspeichers, da es ansonsten auch hier zu Programmabstürzen kommen kann (und in der Regel auch kommt).
Kommentar zu SPSS für Windows: Die beschriebene Problematik beim Umgang mit SPSS wurde erst mit zunehmender Grundkenntnis des Systems und der damit verbundenen besseren Ausnutzung der integrierten Funktionalität immer deutlicher, weshalb ein Applikationswechsel für den vorgegebenen bzw. noch verbleibenden Bearbeitungszeitraum sicherlich zu spät gewesen wäre. Es bleibt aber anzumerken, daß mit Sicherheit schnellere und praktischere Statistiksoftware zu realisieren oder vielleicht sogar schon auf dem Markt erhältlich ist.
Es stellt sich jedenfalls die Frage, welche Rechnerkpazität die Macher von SPSS für Windows voraussetzen, damit das Programmsystem einwandfrei läuft. Sicherlich ist eine Datenmenge von ca. 35.000 Fällen schon ganz anständig, gehört angesichts der bei Volksbefragungen auftretenden Daten (ein Hauptanwendungsfeld der Statistik und der dazugehörigen Software) aber eher zu den Kleineren[3].
2.3 Das Datenmaterial
Das für die Analyse zur Verfügung stehende Datenmaterial stammt aus der Archivierung der Kraftwerks-Emissionswerte auf einem zentralen Umweltrechner innerhalb der Stadtwerke Bremen. In jedem einzelnen Kraftwerk steht ein Emissionsrechner, der die dort anfallenden Meßwerte erfaßt und via DFÜ an den Zentralrechner überträgt. Neben den Emissionswerten werden auch die gemittelten halbstündigen Erzeugerleistungen der einzelnen Blöcke, und im Kraftwerk Hafen noch die vor Ort gemessenen Wetterparameter
- Außentemperatur
- Windgeschwindigkeit
- Windrichtung
- Niederschlag
viertelstündlich erfaßt.
Zusätzlich zu den genannten Daten aus den Emissionsrechnern, stehen noch die zur Kostenabrechnung benötigten viertelstündlichen Energieverbrauchswerte der Stahlwerke Bremen und die vom Lastverteiler-Personal angefertigten subjektiven Wetterbewertungen (heiter, wolkig, Regen...) nebst täglichen Niederschlagsmengen zur Verfügung.
Über telefonische und schriftliche Korrespondenz mit dem Deutschen Wetterdienst wurde des weiteren versucht, Archivdaten über die Bewölkungsverhältnisse in der Stadt Bremen inklusive etwaiger Beleuchtungsdaten zu bekommen, was jedoch durch den hohen Preis (> 4.500 DM) und der Unsicherheit der Effektivität im Sande verlief (siehe Kopie des Schriftverkehrs mit dem Deutschen Wetterdienst im Anhang B).
2.3.1 Aufbereitung des Datenmaterials zur Analyse
Zwecks Verarbeitung und Analyse mußten die genannten Daten zunächst per DDE vom Umweltrechner geladen und in eine Datentabelle des Tabellenkalkulationsprogramms MS Excel geschrieben werden[4], von wo aus sie wiederum in das für die eigentliche Datenanalyse zur Verfügung stehende Programmsystem SPSS für Windows transferiert wurden (siehe auch Kapitel 2.1).
Da für die Analyse nicht die Erzeugerleistungen jedes einzelnen Kraftwerks von Bedeutung sind, sondern nur die Gesamterzeugerleistung aller einspeisenden Energiequellen, wurden die genannten Einzelwerte aufsummiert und erst dann an das Statistikprogramm SPSS weitergegeben.
Vor der genannten Aufsummierung der Einzelwerte mußte zunächst der Eigenbedarf der Kraftwerksblöcke aus den Leistungswerten herausgerechnet werden (Berechnung der Netto-Erzeugerleistung), da dieser dem Endverbraucher nicht zur Verfügung steht, und somit die Ergebnisse verfälschen würde. Beim Einsatz eines Prognosesystems muß dann lediglich der Eigenbedarf des Kraftwerks wieder hinzugerechnet werden, um die tatsächlich zu erzeugende Leistung zu erhalten. Dies passiert natürlich erst bei der täglichen Kraftwerkseinsatzplanung/-optimierung, weil der Eigenbedarf von der jeweils eingesetzten Maschine abhängt und nicht pauschal zu bemessen ist.
Der Eigenbedarf der Kraftwerksblöcke wurde dabei mit einem festen Prozentsatz angenommen, der zunächst einmal davon abhängig ist, um welchen Kraftwerkstypen es sich handelt. Dieser Eigenbedarf des betreffenden Kraftwerks ist natürlich nicht konstant, sondern hängt ganz wesentlich vom Belastungsgrad und der Einsatzdauer ab. Eine genaue Analyse und Einberechnung des Eigenbedarfs als Funktion verschiedener Parameter hätte jedoch im Verhältnis zum entstandenen Aufwand nicht den großen Nutzen gehabt (vor allem aufgrund der später beschriebenen Dateninkonsistenz), weshalb hier darauf verzichtet wurde.
Die Abrechnung der Eigenbedarfswerte ergibt sich aus der folgenden Aufstellung:
Abbildung in dieser Leseprobe nicht enthalten
Tabelle 2.1: Kraftwerkseigenleistungen
Die weiter oben beschriebene, teilweise nicht zu umgehende Vorgehensweise beim Umgang mit den Daten brachte zwei wesentliche Handling-Probleme mit sich:
1. Die Tabellenkalkulation MS Excel ist nur in Lage Zeitreihen mit maximal 16.384 Werten auf einmal aufzunehmen, was bei halbstündigen Werten in etwa 10 Monaten entspricht und bei einem angepeilten Betrachtungszeitraum von 3½ Jahren eine Aufteilung auf 4 Excel-Dateien erforderlich macht, wodurch wiederum alle Berechnungen viermal gemacht werden mußten.
2. Der Transfer der Daten von MS Excel zu SPSS für Windows mußte über die MS Windows Zwischenablage geschehen, was sich als relativ langwieriger Prozeß herausstellte
Da sich sämtliche Betrachtungen auf den Leistungsbedarf der Stadt Bremen, ohne die Stahlwerke beziehen sollen, mußten die nun im SPSS-System stehenden Daten noch um den Anteil der Stahlwerke bereinigt werden, was (sogar mit SPSS) denkbar einfach war, da es sich hierbei um eine simple Subtraktion handelte. Bevor allerdings diese Berechnung durchgeführt werden konnte, mußten die viertelstündlichen Energieverbrauchswerte der Stahlwerke Bremen auf Halbstundenwerte dezimiert werden. Dies wurde durch simple gleitende Durchschnittsberechnung aus jeweils 2 Werten und nachfolgende Eliminierung jedes zweiten Wertes erreicht.
2.3.2 Korrektur des inkonsistenten Datenmaterials
Eine sich bei der später beschriebenen Datenanalyse herausstellende Problematik war die der Dateninkonsistenz. Durch anfallende Reparaturarbeiten, TÜV-Inspektionen oder einfach durch einen kurzzeitigen Ausfall der Rechneranlage, kommt es in unregelmäßigen Zeitabständen zu Ausfällen der Datenerfassung, wodurch die insgesamt archivierten Datenbestände zwar größtenteils nur kleine Unstimmigkeiten, des häufigeren jedoch auch große Verfälschungen aufwiesen. Dies ist seitens der Stadtwerke ohne Probleme zu vertreten, da die Leistungsdaten momentan nur zu statistischen Zwecken erfaßt werden.
Die Problematik bei der Bearbeitung inkonsistenter Daten liegt auf der Hand[6] ; sämtliche Analyseergebnisse sind unterschiedlich stark verfälscht und können nicht nach Güte eingestuft werden, weshalb eine Nachbearbeitung zwingend notwendig ist.
Die größten Probleme der Datenaufbereitung sind mit Abstand die der Detektio und der Lokalisierung der fehlerbehafteten Daten. Fällt beispielsweise bei einer TÜV-Inspektion lediglich eine Datenquelle (= erzeugte Leistung eines Blocks) für die Erfassung aus, so fällt dies in der Gesamtsumme der Erzeugerdaten unter Umständen gar nicht ins Gewicht, denn Leistungssprünge von bis zu 50 MW innerhalb einer halben Stunde sind keine Seltenheit im betrachteten Versorgungsgebiet (siehe dazu auch Kapitel 2.3.4 Charakteristiken ab Seite 20).
Trotzdem wurde eine Korrektur der Daten unter Zuhilfenahme großer (vermeintlicher) Laständerungen vorgenommen, die sich in folgenden Schritten vollzog:
1. Der gesamte Datensatz der Netto-Erzeugerwerte wurde auf Leistungssprünge ³50 MW innerhalb einer halben Stunde, also von einem Wert zum Nächsten, und auf Leistungssprünge ³80 MW innerhalb einer ganzen Stunde hin untersucht und gegebenenfalls gekennzeichnet.
2. Vergleich der markierten Leistungsdaten mit den vom Lastverteiler-Personal per Hand in den sog. Lastverteiler-Ablesebogen eingetragenen 1-Stunden-Werten und Korrektur der Daten anhand der extrapolierten 1-Stunden-Werte, sofern dies erforderlich war.
Die Anzahl der so zu korrigierenden Daten belief sich auf ca. 1-2% des Gesamtdatensatzes, was deutlich macht, wie wichtig eine Vorabüberprüfung des zu analysierenden Datenmaterials ist.
2.3.3 Charakteristische Datenaufteilung
Bei der weiteren Betrachtung und Analyse des Datenmaterials wird es immer wieder zu Unterteilungen des Datenmaterials anhand verschiedener Charakteristiken kommen, d.h. die Daten werden nach bestimmten Gesichtspunkten gefiltert.
Dies ist besonders dann von Bedeutung, wenn weniger starke Zusammenhänge aufgedeckt werden sollen, die bei einer Betrachtung des gesamten Datenmaterials schlecht oder gar nicht zu erkennen sind. In diesen Fällen ist immer ein gewisses Maß an Fingerspitzengefühl von Nöten, da eine Filterung der Gesamtdaten immer auch eine Manipulation der Analyseergebnisse zur Folge hat[7]. Diese Tatsache darf bei der Gewichtung der Zusammenhänge nicht vernachlässigt werden, da eine eindeutige Korrelation zum Beispiel auch bei der Betrachtung des gesamten Datenmaterials zu erkennen ist oder zumindest sein sollte.
Trotzdem ist die Datenfilterung ein unverzichtbares Hilfsmittel zur Aufdeckung etwaiger Kausalitäten. Teilweise macht sogar nur die Betrachtung gefilterter Daten einen Sinn, da zum einen –wie eine alte Weisheit ja richtiger Weise sagt– der Vergleich von Äpfeln und Birnen nur wenig nutzbare Erkenntnisse mit sich bringt, und zum anderen ist es stets anzuraten, innerhalb einer Analyse so viele Parameter wie möglich konstant zu halten, um hierdurch die Anzahl der aktiven Einflußgrößen zu minimieren.
Um einen Bezug zum hier untersuchten Datenmaterial zu bekommen, seien exemplarisch die folgenden Filterkriterien erwähnt:
Filterung nach
- Tageszeit (Uhrzeit),
- Temperatur,
- Luftfeuchtigkeit,
- Wochentagen, Wochenenden,
- Feiertagen,
- Jahreszeit und
- Urlaubszeit.
Sollte in der Analyse eine Filtervariable gesetzt sein, so wird dies explizit erwähnt, egal ob es sich um eine unabdingbare Filterung handelt (z.B. Betrachtung eines bestimmten Zeitraumes), oder ob die Aufteilung der Daten nur aufgrund der schlechten Sichtbarkeit bestimmter Zusammenhänge gemacht wurde.
2.3.4 Charakteristiken
Analog zu den in Kapitel 2.3.3 gemachten Äußerungen, sollen in diesem Kapitel die Daten hinsichtlich ihrer wesentlichen Charakteristiken untersucht und Rückschlüsse auf günstige Datenunterteilungen vorgenommen werden. Auch soll einmal prinzipiell festgestellt werden, in welchem Bereich die Prognose eher unsicher und in welchem Bereich eine „Prognose per Auge“ möglich sein wird.
[...]
[1] Das überschüßige Gas wird einfach nur verbrannt, damit es nicht in die Umwelt gelangt.
[2] Im weiteren Verlauf wird in zweideutiger Weise der Begriff Wochentage benutzt: Wochentage im Sinne von Arbeitstagen und Wochentage im Sinne von Tagen der gesamten Woche (Mo - So). Die jeweilige Bedeutung geht (hoffentlich) aus dem jeweiligen Kontext hervor.
[3] Eines der "großen" Leistungsmerkmale des SPSS-Systems ist laut Hersteller die uneingeschränkte Anzahl zu analysierender Fälle.
[4] Der Transfer in das Programm MS Excel war programmtechnisch unabdingbar
[5] Die hier gemachten Angaben sind Erfahrungswerte des Lastverteiler-Personals
[6] Siehe auch Kapitel 2.3.3: Charakteristische Datenaufteilung auf Seite 19
[7] Dieser Umstand hat der Statistik auch den mehr oder weniger gerechtfertigten Ruf der Unzuverläßigkeit erbracht: "Traue keiner Statistik, die Du nicht selbst gefälscht hast“
- Arbeit zitieren
- Manfred Damsch (Autor:in), 1997, Erstellung eines Prognosesystems für die elektrische Lastganglinie des 50Hz-Netzes der Stadtwerke Bremen AG, München, GRIN Verlag, https://www.grin.com/document/40479
-
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen. -
Laden Sie Ihre eigenen Arbeiten hoch! Geld verdienen und iPhone X gewinnen.