„Residuenquadratsumme“ – Versionsunterschied

[gesichtete Version][gesichtete Version]
Inhalt gelöscht Inhalt hinzugefügt
+links
Überarbeiten Baustein eingefügt da es keinerlei Erklärung zu den Formelzeichen in dem Artikel gibt. Hier gibt die englischen Wikipedia eine bessere Erklärung an.
Zeile 1: Zeile 1:
{{Überarbeiten|grund=Es fehlt eine Erklärung der Formelzeichen.}}
[[Datei:Linear least squares example2.png|mini|[[Lineare Regression]]: Grüne vertikale Linien sind die Residuen.]]
[[Datei:Linear least squares example2.png|mini|[[Lineare Regression]]: Grüne vertikale Linien sind die Residuen.]]
[[Datei:Coefficient of Determination.svg|thumb|Die blauen Vierecke sind Residuenquadrate. Die roten Flächen bezeichnen die [[Gesamte Abweichungsquadratsumme]].]]
[[Datei:Coefficient of Determination.svg|thumb|Die blauen Vierecke sind Residuenquadrate. Die roten Flächen bezeichnen die [[Gesamte Abweichungsquadratsumme]].]]

Version vom 19. April 2018, 02:55 Uhr

Lineare Regression: Grüne vertikale Linien sind die Residuen.
Die blauen Vierecke sind Residuenquadrate. Die roten Flächen bezeichnen die Gesamte Abweichungsquadratsumme.

Die Residuenquadratsumme (engl. residual sum of squares, kurz RSS oder SSR) bezeichnet in der Statistik die Quadratsumme von beobachteten Werten und den durch ein Modell vorhergesagten Werten.[1] Eine solche Abweichung wird Residuum genannt oder einfach nur Fehler (engl. error). Sie ist damit ein Gütekriterium für ein lineares Modell und beschreibt die Ungenauigkeit des Modells. Die Residuenquadratsumme wird auch als die nicht erklärte Abweichungsquadratsumme bezeichnet.

In einem Modell mit nur einer erklärenden Variable ist RSS gegeben durch:

Im einfachsten Fall handelt es sich bei dem Modell um den Gesamtmittelwert. Dann wird dieser Ausdruck entsprechend als gesamte Abweichungsquadratsumme bezeichnet. Im Kontext der einfachen linearen Regression lässt sich dieser Zusammenhang auch wie folgt ausdrücken:

Die Methode der kleinsten Quadrate versucht hier die Residuenquadratsumme zu minimieren (vgl. Minimierung der Summe der Fehlerquadrate). Ein spezielleres Konzept ist die PRESS-Statistik (predicted residual sum of squares).

Um etwa einen F-Test durchzuführen sind oft mittlere Abweichungsquadratsummen von Interesse. Dividiert man die Residuenquadratsumme durch die residualen Freiheitsgrade erhält man den durchschnittlichen Anteil von Varianz der durch äußere Variablen erklärt wird (die unsystematische Varianz). Ein F-Test berechnet dann nur noch den Anteil der erklärten mittleren Varianz im Verhältnis der mittleren Residuenquadratsumme.

Matrixnotation der Residuenquadratsumme

Die gewöhnlichen Residuen, die durch die Kleinste-Quadrate-Schätzung gewonnen werden, sind in der multiplen linearen Regression gegeben durch[2]

.

Die Residuenquadratsumme ergibt sich also aus dem Produkt zwischen dem transponierten Residualvektor und dem nicht-transponierten Residualvektor

Einzelnachweise

  1. Field, Andy. Discovering statistics using SPSS. Sage publications, 2009. S. 202.
  2. Ludwig Fahrmeir, Thomas Kneib, Stefan Lang: Regression: Models, Methods and Applications., S. 77