Statistik 2017/2018

Varianzzerlegung - Regression - Korrelation

a) Was ist die Regressionsgerade?
b) Wieso gibt es zwei Regressionsgerade?
c) Wann fallen die beiden Regressionsgeraden zusammen?
d) Wann stehen sie orthogonal (im rechten Winkel) zueinander?
e) Begründen Sie letzteres.
f) Ist der Anstieg der Regressionsgerade von Bedeutung?
(6 Antworten)

  • Die Regressionsgerade ist jene Gerade, die so durch einen Punktschwarm gelegt wird, dass die Residualvarianz ein Minimum wird. Anders ausgedrückt: So dass die quadrierten Residuen (Differenzen zwischen den beobachteten Werten und der Regressionsgeraden) ein Minimum ergeben.
  • In der Regel gibt es zwei Regressionsgeraden, weil die Schätzung der y-Werte () aufbauend auf die Variable X und die Schätzung der x-Werte () aufbauend auf die Variable Y nicht symmetrisch ist.
  • Diese beiden Geraden fallen nur dann zusammen, wenn die Korrelation maximal ist;
    d.h. wenn r = 1 oder r = -1.
  • Diese stehen orthogonal zueinander, wenn die Variablen nicht korrelieren;
    d.h. wenn r = 0. In diesem Fall ist eine Gerade waagrecht und die andere senkrecht.
  • Erklärung: Wenn die Variablen X und Y nicht korrelieren, ist bei jedem x die beste Schätzung der Mittelwert y und bei jedem y die beste Schätzung der Mittelwert x .
  • Der Anstieg der Regressionsgerade ist ohne Bedeutung, weil man die Variablen X und Y beliebig skalieren kann – und so den Anstieg beliebig steil erscheinen lassen (z.B. Millimeter statt Zentimeter). Was zählt ist das Verhältnis aus erklärter Varianz und Residualvarianz.

Diskussion