Die Arbeit befasst sich mit der Analyse der Miethöhe. Dabei stellt sich die Frage, welche Faktoren die Miethöhe am stärksten beeinflussen, das Alter der Mieter, der Erwerbsstatus, die Größe der Wohnung, etc.
Dabei liegt der Schwerpunkt auf statistischen Analyseverfahren – untersucht wird die mögliche Abhängigkeit anhand der Regressionsanalyse (einfache, partielle und multiple Regression) und Varianz- bzw. Kovarianzanalyse. Dabei wird mit Daten aus dem Mikrozensus gearbeitet.
Inhaltsverzeichnis
1. Einleitung
2. Datensatz
3. Analyse: Regression
3.1 Einfache Regression
3.2 Partielle Regression
3.3 Multiple Regression
4. Analyse: Varianz / Kovarianz
4.1 Einfaktorielle Varianzanalyse
4.2 Zweifaktorielle Varianzanalyse
4.3 Kovarianzanalyse
5 Fazit
6 Literatur
Anhang
1. Einleitung
In der vorliegenden Arbeit werde ich einige multivariate Analysemethoden erklären. Dabei werde ich mit Daten aus dem Mikrozensus arbeiten, um die Regression und Korrelation sowie die Varianz- und Kovarianzanalyse näher zu erläutern.
Als erstes werde ich eine kurze Einleitung zum Mikrozensus und den mir vorliegenden Variablen geben. Es wird darum gehen, die Miethöhe näher zu untersuchen. Von welchen Variablen ist die Miethöhe abhängig, vom Alter, dem höchsten Bildungslabschluss, der Größe der Wohnung, ...? Und wie stark ist die Abhängigkeit; sticht sie bei einer Variablen besonders hervor oder ist sie von allen Variablen gleich stark abhängig?
Anfangen werde ich mit der einfachen Regression, erläutere dann die partielle Regression und abschließend die multiple Regression.
Als zweiten Analyseweg werde ich dann noch die Varianz- und Kovarianzanalyse genauer betrachten.
Abschließend wird ein kurzes Fazit gezogen.
2. Datensatz
Der Datensatz, mit dem ich mich beschäftigen werde, stammt aus dem Mikrozensus; vorneweg ein paar kurze Informationen zu diesem. Der Mikrozensus ist eine amtliche repräsentative Statistik, die sich unter anderem mit der Bevölkerungsentwicklung und dem Arbeitsmarkt beschäftigt. Jährlich werden an einem Stichtag 1% aller Haushalte befragt, dass sind ungefähr 370.000 Haushalte und 820.000 Personen. Die Fragen zur sozialen und wirtschaftlichen Lage müssen von den zufällig ausgewählten Haushalten beantwortet werden. Jeder Haushalt wird vier Jahre in Folge befragt.
In dem mir vorliegenden Datensatz, sind insgesamt 29 Variablen aufgeführt. Sie enthalten persönliche Informationen (wie Alter, Geschlecht, Familienstand), Informationen zur Berufstätigkeit, Bildungsabschluss, Finanzen und der Wohnung sowie Miethöhe.
Ich werde mich mit der Miethöhe beschäftigen und herausarbeiten, wovon sie abhängt und wie stark die Zusammenhänge sind. Dies werde ich, wie schon in der Einleitung erwähnt, anhand der Regression und Korrelation, sowie der Varianz- und Kovarianzanalyse erläutern.
Bevor ich mit den eigentlichen Analysen anfange, ein paar allgemeine Informationen zum Datensatz.
Insgesamt wurden 2216 Personen befragt, wobei 49% männlich und 51% weibliche waren. 35,3% der Befragten gaben ledig als Familienstand an und 53,8% verheiratet. Bei der relativ hohen Anzahl der ledigen Personen, muss man beachten, dass auch an Kinder und Jugendliche diese Frage gerichtet wurde, bzw. eine erwachsene Person aus dem Haushalt ihren Fragebögen ausfüllte. Wenn man die Kinder und Jugendlichen von den ledigen Personen abzieht, erhält man noch ca. 16% ledige Personen über 18 Jahren. Knapp 4% der Befragten sind geschieden und 7% verwitwet.
Auch wurde nach dem Alter der Personen gefragt. Die Antworten liegen als Einzeldaten vor, so dass ich sie klassiert habe. Kinder (zwischen 0 und 12 Jahren) wurden zu 13,2% befragt, Jugendliche (zwischen 13 und 18 Jahren) zu 6,6%. Die Grenze für Jugendliche habe ich bei 18 Jahren festgelegt. Mit 18 Jahren ist man volljährig und kann ohne Probleme ausziehen und getrennt von seinen Eltern leben. Dies ist natürlich auch schon vorher möglich, kommt aber seltener vor.
Da es bei der Analyse um die Miethöhe gehen soll, habe ich die nächste Klasse als „junge Erwachsene“ bezeichnet. Die Gruppe der 19-30 befindet sich zum Teil noch in einer Ausbildung und gründet erst noch eine Familie. Der Anteil aller Befragten in dieser Gruppe ist 12,2%. Die nächste Gruppe „Erwachsene“ mit 51,6% aller Befragten ist die größte Gruppe. Die Personen stehen „mitten im Leben“ und haben meistens (wenn der Wunsch vorhanden war) eine Familie gegründet. Sie haben eine Job und befinden sich (von Ausnahmen abgesehen) nicht mehr in der Ausbildung sondern im Berufsleben. Sie können also, nach ihren Wünschen und Möglichkeiten eine Wohnung beziehen.
Als letzte Gruppe habe ich „Rentner“ ausgewählt (ab 65 Jahren). In dieser Gruppe, wird die Miethöhe wahrscheinlich sinken, da Rentner entweder alleine oder zu zweit leben. Die Kinder leben in dem Lebensabschnitt für gewöhnlich nicht mehr bei ihren Eltern.[1]
Im Folgenden sollen nun statistische Methoden erklärt werden. Beispiel dafür ist immer die Miethöhe und wovon sie abhängt, vom Einkommen, Größe der Wohnung, Familienstand, Alter, Haushaltsgröße, usw.
Die Angaben zur Miethöhe waren freiwillig und wurden in klassierten Werten aufgenommen. Beantwortet haben die Frage 1151 Personen, so dass sich 1065 fehlende Werte ergeben.
Auch gaben einige Personen an, dass sie 0 DM an Miete zahlen müssen oder nur sehr geringe Beträge. Es ist davon auszugehen, dass es sich bei diesen Befragten unter anderem um Personen handelt, die noch bei ihren Eltern leben und keinen Beitrag zur Miete leisten.
3. Analyse: Regression
Geprägt wurde der Begriff „Regression“ im 19. Jahrhundert von dem englischen Wissenschaftler Sir Francis Galton. Er untersuchte die Abhängigkeit der Körpergröße von Vätern und Söhnen.
Heute wird die Regressionsanalyse dazu genutzt um die Beziehung zwischen einer unabhängigen Variable und einer abhängigen Variable zu untersuchen. Dabei muss die abhängige Variable immer ein metrisches Skalenniveau vorweisen. Bei der unabhängigen Variable ist es von Vorteil, wenn sie über ein metrisches Skalenniveau verfügt, man kann aber auch durch die Anwendung der „Dummy-Variablen-Technik“[2] mit nominalskalierten Daten arbeiten.
Dadurch ist die Regressionsanalyse äußerst flexible und ein sehr häufig angewandtes statistisches Analyseverfahren.
In dieser Arbeit soll die Regression anhand des Beispiels der Miethöhe erklärt werden. Die Miethöhe ist eine metrische Variable und in diesem Fall die abhängige. Somit stellt sich die Frage, ob die Miethöhe nur von einer weiteren Variable, wie beispielsweise der Gesamtfläche der Wohnung in qm, abhängig ist, oder aber von mehreren Variablen.
3.1 Einfache Regression
Bei der einfachen Regression sind zwei zu untersuchende Variablen vorhanden, die auf ihre Abhängigkeit überprüft werden sollen. In diesem Fall wäre das die Miethöhe (abhängige Variable, y) und die Gesamtfläche der Wohnung in qm (unabhängige Variable, x). Beide Variablen besitzen ein metrisches Skalenniveau.
Um sich einen ersten Eindruck zu verschaffen und die Richtung des Zusammenhangs angeben zu können, bietet es sich an, ein Streudiagramm zu zeichnen. Dabei werden alle empirisch erhobenen Werte in ein Koordinatensystem eingezeichnet.
Graphik 1: Streudiagramm
Abbildung in dieser Leseprobe nicht enthalten
Das Streudiagramm wurde mit Hilfe des Statistikprogramms SPSS erstellt. Die roten Punkte lagen sehr nahe beieinander, so dass die Funktion „Sonnenblume“ angewandt wurde. Man sieht, dass im untern linken Bereich sich die Fälle sehr stark häufen und an den Rändern weniger werden. In der Graphik 2 auf Seite 9 habe wurde die Funktion nicht verwendet, so dass dort die empirisch ermittelten Werte genau angezeigt werden.
Es gibt fünf auffällige Ausreißer, wobei zwei für eine „kleine“ Wohnung relativ viele Miete zahlen müssen, im Vergleich zu den restlichen Haushalten und zwei, die relativ wenig für eine „große“ Wohnung zahlen müssen. Außerdem gab eine Person an, für eine 400 qm große Wohnung keine Miete zahlen zu müssen. In diesem Fall ist davon auszugehen, dass es sich um einen Jugendlichen oder ein Kind handelt, welches noch bei den Eltern wohnt oder ein Rentner, der bei seinen Kinder wohnt. Auch möglich ist, dass es sich um eine Eigentumswohnung handelt. Ebenso sind die weiteren Punkte zu interpretieren, die auf der x-Achse liegen und keine Miete zahlen müssen.
Nachdem man die empirischen Werte in das Koordinatensystem eingezeichnet hat, kann man eine Aussage über die Richtung und die Stärke des Zusammenhangs machen.
Die Punkte liegen alle (bis auf wenige Ausnahmen) relativ nahe beieinander, so dass man davon ausgehen kann, dass es sich um einen mittleren Zusammenhang zwischen der Miethöhe und der Gesamtfläche der Wohnung handelt. Außerdem könnte man ein gedachte Linie durch die Punkte zeichnen (Regressionsgerade). Diese würde von links unten nach rechts oben verlaufen, was auf einen positiven Zusammenhang hinweist. Dies würde in Hypothesenform bedeuten: „Je größer die Wohnung, desto höher ist der Mietpreis.“
Nun muss die Regressionsfunktion (y = a + b * x) ermittelt werden. „b“ ist der Regressionskoeffizient und „a“ gibt den Ordinatenabschnitt an.
Dies wurde mit Hilfe von SPSS errechnet.
Koeffizienten(a)
Abbildung in dieser Leseprobe nicht enthalten
a Abhängige Variable: F118 Miethöhe im April 1998
ANOVA(b)
Abbildung in dieser Leseprobe nicht enthalten
a Einflussvariablen : (Konstante), F109 Gesamtfläche der Wohnung in qm
b Abhängige Variable: F118 Miethöhe im April 1998
Anhand der ersten Tabelle (Koeffizienten) kann man die Regressionsfunktion ablesen. Somit ist:
Abbildung in dieser Leseprobe nicht enthalten
Demnach würde eine Wohnung von 300 qm 2209,559 DM kosten. Nachdem man die Regressionsgleichung ermittelt hat, kann man auch die Regressionsgerade in die Graphik einzeichnen.
Graphik 2: Streudiagramm mit Regressionsfunktion
Abbildung in dieser Leseprobe nicht enthalten
Anhand der zweiten Tabelle (ANOVA) kann man auf die Varianz schließen. Durch diese Regressionsgleichung (Quadratsumme der Regression) wird ermittelt, welcher Anteil der Varianz durch sie erklärt wird.
Abbildung in dieser Leseprobe nicht enthalten
Die Quadratsumme der Residuen zeigt, wie hoch der Anteil der nicht erklärten Varianz ist.
In diesem Fall werden nur 21,9% der Varianz der abhängigen Variablen durch die unabhängige Variablen erklärt.
Weiterhin wichtig zu erfahren ist natürlich noch, wie groß der Zusammenhang zwischen der Miethöhe und der Gesamtfläche der Wohnung ist. Dafür muss man den Korrelationskoeffizienten r nach Bravais-Pearson berechnen (ebenfalls mit SPSS).
[...]
[1] Daten: siehe Anhang, S. 28
[2] Siehe Backhaus, Jahr, S. 50
- Quote paper
- Diplom-Sozialwissenschaftlerin Manuela Kulick (Author), 2006, Analyse der Miethöhe mit Hilfe von SPSS. Regression-, Varianz- und Kovarianzanalyse, Munich, GRIN Verlag, https://www.grin.com/document/64674
-
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X. -
Upload your own papers! Earn money and win an iPhone X.