Statistik 2017/2018

Varianzzerlegung - Regression - Korrelation

Was bedeuten folgende Ausdrücke bei einer Regression / Korrelation?
a) Gesamtvarianz,
b) erklärte Varianz und
c) Residualvarianz bei einer Korrelation?
d) Wie hängen diese drei Größen zusammen?
e) Was ist das Bestimmtheitsmaß?
f) und was bedeutet es?
g) Was passiert, wenn man bei einer Korrelation die Variablen X und Y vertauscht?
(7 Antworten)

Wenn man aus der Variable X die Variable Y schätzt, geht es bei der Gesamtvarianz um die Varianz der Variable Y – bei umgekehrter Schätzung (von Y auf X) um die Varianz der Variable X. Für das Beispiel gehen wir davon aus, dass Y vorhergesagt wird.
  • Die Gesamtvarianz ist die Abweichungsquadratsumme der beobachteten Werte y vom Mittelwert . Diese berechnet man, indem man alle beobachteten Werte y vom Mittelwert  abzieht, die Differenzen quadriert, summiert und die Summe durch n dividiert (durchschnittliche Abweichungsquadrat­summe) – ohne dabei die X-Werte zu beachten.
  • Die erklärte Varianz ist die Abweichungsquadratsumme der geschätzten Werte vom Mittelwert. Diese berechnet man, indem man von allen geschätzten Werten den Mittelwert  abzieht, die sich ergebenden Differenzen quadriert, summiert und die Summe durch n dividiert.
  • Die Residualvarianz ist die Abweichungsquadratsumme der beobachteten Werte y von der Regressionsgerade. Diese berechnet man, indem man alle beobachteten Werte y von den geschätzten Werten abzieht, die sich ergebenden Residuen quadriert, summiert und die Summe durch n dividiert.
  • Die Residualvarianz plus die erklärte Varianz ergibt die Gesamtvarianz.
  • Das Bestimmtheitsmaß (B) berechnet man als Quadrat der Korrelation (r2)
  • Das Bestimmtheitsmaß entspricht dem Anteil der aus dem Zusammenhang erklärten Varianz an der Gesamtvarianz.
  • Wenn man die Variablen X und Y vertauscht, also von Y ausgehend X schätzt, kommt man zu identischen Ergebnissen die Varianzzerlegung betreffend, allerdings zu einer anderen Geraden.

Diskussion