Die folgende Studienarbeit basiert auf der Anwendung der Software SPSS. Diese wurde erstmals im Jahre 1960 auf Großrechnern genutzt. Die Abkürzung SPSS stand damals für Statistical Package for the social sciences. Entwickelt hat dieses Produkt die gleichnamige Firma SPSS aus den USA, die vornehmlich quantitative Analysen erstellte. Das Einsatzgebiet erstreckte sich dabei vornehmlich auf die statistische Erforschung der Sozialwissenschaften. Inzwischen wurde das Programm zeitgemäß weiterentwickelt und ist mittlerweile auf verschiedenen Betriebssystemen erhältlich. Die aktuelle Version 13 ist an PC Systeme mit Windows angepasst. Heutzutage wird das Programm auch in den Wirtschaftswissenschaften mit dem Ziel der Informationsverarbeitung, -analyse und -auswertung eingesetzt.
Inhaltsverzeichnis
Abkürzungsverzeichnis
Abbildungsverzeichnis
Tabellenverzeichnis
1 Einleitung
1.1 Vorlesung Praxis der Informationsverarbeitung/SPSS
1.2 Vorstellung des Projekts
1.3 Ziel des Projektes
2 Erstellung und Plausibilitätsprüfungen der Rohdaten
2.1 ID Nummer
2.2 Alter
2.3 Geschlecht
2.4 Beschäftigungen
2.5 Surfdauer
2.6 Trafficvolumen
2.7 Internetnutzung
3 Auswertung der Rohdaten
3.1 Berechnung der Monatssurfdauer
3.2 Berechnung des Monatstraffics
3.3 Berechnung der bisherigen Monatskosten
3.4 Bildung von Interessensgruppierungen
3.5 Festlegung des Rechnungsfaktors
3.6 Berechnung der neuen Monatskosten
3.7 Auswahl des günstigsten neuen Anschlusses
3.8 Kostendifferenz zwischen neuem und alten Anschluss
3.9 Erstellung von Angeboten (nach Interessengruppierungen)
4 Ergebnisse und Interpretationen
4.1 Häufigkeiten der Stammdaten
4.2 Verteilung der Tarife
4.3 Zusammenhang zwischen monatlicher Surfdauer und Traffic
4.4 Vergleich der Monatskosten
4.5 Interessengruppierungen nach Beschäftigung
5 Schlussbetrachtung
Quellenverzeichnis
Ehrenwörtliche Erklärung
Anhang
Abkürzungsverzeichnis
SPSS = S tatistical P ackage for the S ocial S ciences
ID = Id entification
ISDN = I ntegrated S ervices D igital N etwork
DSL = D igital S ubscriber L ine
MB = M ega b yte
USA = U nited S tates of A merica
PC = P ersonal C omputer
SMS = S hort M essage S ervice
Abbildungsverzeichnis
Abb. 1: Häufigkeit pro Alter
Abb. 2: Zusammenhang zwischen monatlicher Surfdauer und Traffic
Tabellenverzeichnis
Tab. 2: Die Beschäftigungen
Tab. 3: Praktisch maximale Surfdauer
Tab. 4: Extrema und Mittelwerte für den Traffic
Tab. 5: Die Kategorien der Internetnutzung
Tab. 6: Die Prioritäten der Internetnutzung
Tab. 7: Extrema der Prioritätssummen
Tab. 8: Die Auswertung der Rohdaten
Tab. 9: Berechnungsschema der bisherigen Kosten
Tab. 10: Interessengruppierungen
Tab. 11: Rechnungsfaktor nach Beschäftigungsgruppe
Tab. 12: Analoges, ISDN und DSL Surfdauer Tarifmodell
Tab. 13: DSL Traffic Tarifmodell
Tab. 14: Anzahl der Beschäftigungen nach Geschlecht
Tab. 15: Anzahl der neuen Tarife
Tab. 16: Korrelationen von monatlicher Surfdauer und monatlichem Traffic
Tab. 17: Vergleich der Monatskosten
Tab. 18: Gruppenzugehörigkeit nach Beschäftigungen
1 Einleitung
Die folgende Studienarbeit basiert auf der Anwendung der Software SPSS. Diese wurde erstmals im Jahre 1960 auf Großrechnern genutzt.[1] Die Abkürzung SPSS stand damals für Statistical Package for the social sciences.[2] Entwickelt hat dieses Produkt die gleichnamige Firma SPSS aus den USA, die vornehmlich quantitative Analysen erstellte. Das Einsatzgebiet erstreckte sich dabei vornehmlich auf die statistische Erforschung der Sozialwissenschaften. Inzwischen wurde das Programm zeitgemäß weiterentwickelt und ist mittlerweile auf verschiedenen Betriebssystemen erhältlich. Die aktuelle Version 13 ist an PC Systeme mit Windows angepasst. Heutzutage wird das Programm auch in den Wirtschaftswissenschaften mit dem Ziel der Informationsverarbeitung, -analyse und –auswertung eingesetzt.
1.1 Vorlesung Praxis der Informationsverarbeitung/SPSS
Die erlernten Kenntnisse der Vorlesung Praxis der Informationsverarbeitung/SPSS von Herrn Prof. Dr. Hauk werden in dieser Studienarbeit angewendet. Es handelt sich dabei um ein Pflichtfach des Studiengangs Betriebswirtschaftslehre mit Schwerpunkt Wirtschaftsinformatik an der Fachhochschule Ansbach. In insgesamt 20 Semesterwochenstunden wurden die theoretischen Grundlagen der Softwareanwendung SPSS vertieft. Diese gliederten sich in eine Einführungsphase, in der die Funktionen des Programms vorgestellt wurden und in eine Lernphase in der anhand eines Beispielprojektes die Anwendung geübt werden konnte.[3] Am Ende der Vorlesung mussten die Studenten ein eigenes Projekt vorstellen, das sie mit SPSS durchführen sollten. Dabei konnte es sich um ein reales Projekt handeln, dass zum Beispiel durch eine Umfrage erhoben wurde oder um ein fiktives, dessen Szenario der Student selber erstellen konnte.
1.2 Vorstellung des Projekts
Bei dem hier ausgeführten Projekt „Untersuchung des Surferverhaltens durch einen Internetprovider“ handelt es sich um ein fiktives Szenario. Dieses Projekt erhebt nicht den Anspruch auf besonders genaue Realitätsnähe. Die Vorstellung des folgenden Unternehmens soll nicht in beabsichtigter Weise die Situation auf dem Markt der Internetprovider widerspiegeln. Außerdem sind die Ergebnisse in Kapitel 4 nicht als repräsentativ zu werten, sondern sollen vielmehr die statistischen Auswertungs-möglichkeiten durch SPSS aufzeigen.
Der Internetprovider „No limits“ ist seit erst eineinhalb Jahren auf dem Markt tätig. Er bietet über einen analogen Telefonanschluss call-by-call einen Internetzugang an. Nach anfänglich raschen Kundenakquisitationen musste jedoch im letzten halben Jahr fast eine Stagnation festgestellt werden. Dies ist nach Meinung der Geschäftsführung auf die neue Konkurrenz in der Branche zurückzuführen, die unter anderem unterschiedliche Internetanschlüsse zu billigen Preisen anbietet. Deshalb hat „No limits“ die Akquisitation des 100. Kunden zum Anlass genommen durch eine Analyse das Surfverhalten der bisherigen Kunden zu untersuchen. Als Material der Studie (Rohdaten) dienen zum einen einige der Kundenstammdaten, des Weiteren die Bewegungsdaten zu Surfdauern und Trafficvolumina. Ebenfalls wurden durch eine Kundenumfrage wertvolle Ergebnisse zu den Präferenzen der Internetnutzung gewonnen.
1.3 Ziel des Projektes
Mit den oben genannten und gesammelten Daten erhofft sich das Unternehmen die bisherigen Bedürfnisse und Präferenzen seiner Nutzer besser zu erkennen und durch gezielte Angebote deren Wünschen entgegenzukommen. Zum einen sollen neben den bisherigen analogen Anschluss das Angebot um einen ISDN Anschluss und einen DSL Anschluss erweitert werden. Zum anderen sollen neue Tarife mit einer Grundgebühr erstellt werden, die vor allem für Langzeitnutzer des Internets Kostenvorteile bringen. Darüber hinaus will „No limits“ anhand der Ergebnisse über die Präferenzen der Kunden eine dynamische Homepage einrichten, deren Inhalt sich nach der Anmeldung des Kunden dem gespeicherten Präferenzprofil anpasst. Sekundäre Ziele der Untersuchung stellen Ergebnisse über Datenzusammenhänge oder Tendenzentwicklungen dar.
2 Erstellung und Plausibilitätsprüfungen der Rohdaten
Die Rohdaten stellen die Grundlage für die spätere Analyse da. Tabelle 1 soll einen kurzen Überblick über die verwendeten Rohdaten verschaffen: Es werden die verschiedenen Variablen aufgezählt, deren SPSS Bezeichnungen genannt und deren Quellen aufzeigt. Im 2. Kapitel wird beschrieben, wie diese Variablen erstellt wurden und welche Plausibilitätsprüfungen mit ihnen durchgeführt wurden, um mögliche Falscheingaben zu korrigieren.
Abbildung in dieser Leseprobe nicht enthalten
Tab. 1: Die Rohdaten
Quelle: Eigene Darstellung
2.1 ID Nummer
Die ID Nummer ist eine vom EDV System festgelegte Nummer. Es handelt sich dabei um ganze Zahlen. Der erste Kunde besitzt die ID 1, während der letzte die 100 erhalten hat. Auf diese Weise wird die Vergabe der Nummern stetig aufsteigend fortgesetzt. Die ID Nummer codiert die Stamm- und Bewegungsdaten eines Kunden.
A) Zur Überprüfung der sinnvollen Eingaben bei den Kundennummern, wurde in SPSS überprüft, ob die IDs zwischen 0 und 100 liegen. Falls die Eingaben außerhalb des Intervalls lagen, wurde die ID ein Missing Value (999).
B) Außerdem wurden fehlende Eingaben durch einen Missing Value (999) ersetzt.
2.2 Alter
Das Alter ist wie die ID Nummer aus den Stammdaten übernommen. Als Mindestalter ist ein theoretisches Alter von 6 Jahren möglich. Bis zum 18.Lebensjahr ist ein Vertragsabschluss jedoch nur mit Einwilligung der Eltern möglich. Um Falscheingaben zu vermeiden, wurde ein maximales Alter von 100 festgelegt, da der momentan älteste Nutzer 81 Jahre alt ist.
A) Falls das Alter nicht zwischen 6 und 100 Jahren liegt, wird das Alter ein Missing Value (999).
B) Fehlende Werte werden durch Missing Values (999) ersetzt.
2.3 Geschlecht
Das Geschlecht ist eine relativ simple Eingabe. Entweder ist der Kunde weiblich oder männlich. Aber auch hier sind Fehleingaben möglich.
A) Falls nicht männlich (1) oder weiblich (2) eingegeben wurde, ist die Eingabe ein Missing Value (9).
B) Auch hier werden fehlende Eingaben durch einen Missing Value (9) ersetzt.
2.4 Beschäftigungen
Als letzte Variable mit Quelle aus den Stammdaten sind die Beschäftigungen zu nennen. Hier sind neun verschiedene Eingaben möglich und eine fehlende Eingabe (9). Für jede Beschäftigung ist ein Altersintervall definiert.
Abbildung in dieser Leseprobe nicht enthalten
Tab. 2: Die Beschäftigungen
Quelle: Eigene Darstellung
A) Falls nicht eine der oben genannten Beschäftigungen (0-8) eingegeben wurde, wird der Wert ein Missing Value (9).
B) Falls die eingegebene Beschäftigung nicht innerhalb des oben genannten Jahresintervalls liegt, wird die Beschäftigung ein Missing Value (9).
C) Wenn das Alter zwischen 6 und 16 liegt, ist die Beschäftigung immer Schüler.
D) Fehlende Beschäftigungen werden als Missing Value (9) eingestuft.
2.5 Surfdauer
Die gesamte Surfdauer gliedert sich in vier Wochenmessungen, welche in Stunden angegeben werden. Sie werden in den Bewegungsdaten protokolliert und für die Erstellung der bisherigen Rechnungen herangezogen. Zur Überprüfung der Plausibilität der Surfdauern werden als erstes die Kunden nach ihren Beschäftigungen gruppiert. Für alle Gruppen gilt gemeinsam eine theoretisch maximale Surfdauer pro Woche von 7 Tage x 24 Stunden = 168 Stunden. Davon werden unterschiedliche Zeiten für Schlafen, Arbeiten & Lernen, Haushaltsarbeiten & Alltagsaktivitäten, Essen & Körperpflege abgezogen. Am Ende bleibt die praktisch maximale Surfdauer übrig. Wird diese Obergrenze überschritten, gilt ein protokollierter Wert als unplausibel. Er wird in einen temporären Wert umgewandelt, der später durch einen errechneten Wert ersetzt wird.
[...]
[1] Vgl. http://timo.gnambs.at
[2] Vgl. Wikipedia,2004
[3] Vgl. SPSS Konzept.pdf, Dr. Prof. Hauk
-
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X.