„Mehrdimensionale Normalverteilung“ – Versionsunterschied

[ungesichtete Version][gesichtete Version]
Inhalt gelöscht Inhalt hinzugefügt
Änderung 181939046 von 2003:A:1517:8900:A49E:9CF0:432B:6EDA rückgängig gemacht; Das gehört nicht an diese Stelle und erfordert eine Quellenangabe
Markierung: Rückgängigmachung
(3 dazwischenliegende Versionen desselben Benutzers werden nicht angezeigt)
Zeile 70: Zeile 70:
die einzige multivariate Verteilung, deren Komponenten stochastisch unabhängig sind und deren Dichte zugleich
die einzige multivariate Verteilung, deren Komponenten stochastisch unabhängig sind und deren Dichte zugleich
[[Rotationssymmetrie|rotationssymmetrisch]] ist.
[[Rotationssymmetrie|rotationssymmetrisch]] ist.

=== Streuintervalle ===
Für die Standardnormalverteilung können die Streuintervalle analytisch berechnet werden. Mit <math>r'^2=\sum_{i=1}^p x_i^2</math> liegt der Anteil
:<math>\pi(r)=\frac{\int_0^r f_X(r')r'^{p-1}dp}{\int_0^\infty f_X(r')r'^{p-1}dp}=P(\frac p2,\frac {r^2}2)</math>
der Messwerte höchstens im Abstand <math>r</math> vom Mittelwert (hier: 0). Dabei ist <math>P</math> die regularisierte [[unvollständige Gammafunktion]] der oberen Grenze.

{| class="wikitable"
|+ <math>P(\frac p2,\frac {r^2}2)</math>
|-
! <math>\pi</math> in %
! <math>r=\sigma</math>
! <math>r=2\sigma</math>
! <math>r=3\sigma</math>
|-
! <math>p=1</math>
| 68,27
| 95,45
| 99,73
|-
! <math>p=2</math>
| 39,35
| 86,47
| 98,89
|-
! <math>p=3</math>
| 19,87
| 73,85
| 97,07
|-
|}

Entsprechend kann mit der Umkehrfunktion der Streuradius r angegeben werden, in der ein vorgegebener Anteil an Messwerten liegt:
:<math>r=\sqrt{2 P^{-1}(\frac p2,\pi)}</math>
{| class="wikitable"
! <math>r</math> in <math>\sigma</math>
! <math>\pi=50%</math>
! <math>\pi=90%</math>
! <math>\pi=99%</math>
|-
! <math>p=1</math>
| 0,675
| 1,645
| 2,576
|-
! <math>p=2</math>
| 1,177
| 2,146
| 3,035
|-
! <math>p=3</math>
| 1,538
| 2,500
| 3,368
|-
|}


== Momente und Kumulanten ==
== Momente und Kumulanten ==

Version vom 22. Oktober 2018, 19:23 Uhr

Dichte der bivariaten Normalverteilung im dreidimensionalen Raum

In der multivariaten Statistik ist die mehrdimensionale, oder auch multivariate Normalverteilung genannt eine multivariate Verteilung und stellt eine Verallgemeinerung der (eindimensionalen) Normalverteilung auf mehrere Dimensionen dar.[1] Eine zweidimensionale Normalverteilung wird auch bivariate Normalverteilung genannt.

Bestimmt wird eine mehrdimensionale Normalverteilung durch zwei Verteilungsparameter – den Erwartungswertvektor und durch die Kovarianzmatrix , welche den Parametern und der eindimensionalen Normalverteilungen entsprechen.

Multivariat normalverteilte Zufallsvariablen treten als Grenzwerte bestimmter Summen unabhängiger mehrdimensionaler Zufallsvariablen auf. Dies ist die Verallgemeinerung des zentralen Grenzwertsatz zum mehrdimensionalen zentralen Grenzwertsatz.

Weil sie entsprechend dort auftreten, wo mehrdimensionale zufällige Größen als Überlagerung vieler voneinander unabhängiger Einzeleffekte angesehen werden können, haben sie für die Praxis eine große Bedeutung.

Aufgrund der sogenannten Reproduktionseigenschaft der mehrdimensionalen Normalverteilung lässt sich die Verteilung von Summen (und Linearkombinationen) multivariat normalverteiler Zufallsvariabler konkret angeben.

Die mehrdimensionale Normalverteilung: allgemeiner Fall

10000 Stichproben einer zweidimensionalen Normalverteilung mit , und ρ = 0.7

Eine -dimensionale reelle Zufallsvariable ist normalverteilt mit Erwartungswertvektor und (positiv definiter) Kovarianzmatrix , wenn sie eine Dichtefunktion der Form

besitzt. Man schreibt

Für die zugehörige Verteilungsfunktion gibt es keine geschlossene Form. Die entsprechenden Integrale müssen numerisch berechnet werden.

Der Wert im Exponentialteil der Dichtefunktion entspricht der Mahalanobis-Distanz, welche die Distanz vom Testpunkt zum Mittelwert darstellt. Im Vergleich mit der Dichtefunktion der eindimensionalen Normalverteilung spielt bei der mehrdimensionalen Normalverteilung die Rolle von .

Die mehrdimensionale Normalverteilung hat die folgenden Eigenschaften:

  • Die affine Transformation mit einer Matrix (mit ) und ist -dimensional normalverteilt: . Dies gilt aber nach der hier gegebenen Definition nur, wenn nicht-singulär ist, also eine nicht-verschwindende Determinante hat.
  • Die affine Transformation
standardisiert den Zufallsvektor : es ist (mit Einheitsmatrix ).
  • kann auch eine singuläre Kovarianzmatrix besitzen. Man spricht dann von einer degenerierten oder singulären mehrdimensionalen Normalverteilung. In diesem Fall existiert keine Dichtefunktion.
  • Bedingte Verteilung bei partieller Kenntnis des Zufallsvektors: Bedingt man einen multivariat normalverteilten Zufallsvektor auf einen Teilvektor, so ist das Ergebnis selbst wieder multivariat normalverteilt, für
gilt
,
insbesondere hängt der Erwartungswert linear vom Wert von ab und die Kovarianzmatrix ist unabhängig vom Wert von .

Die Randverteilung der mehrdimensionalen Normalverteilung

Bivariate Normalverteilung mit Randverteilungen

Sei multivariat normalverteilt. Für eine beliebige Partition mit und , , gilt, dass die Randverteilungen und (multivariate) Normalverteilungen sind.

Die Umkehrung gilt allerdings nicht, wie folgendes Beispiel zeigt:

Sei und sei definiert durch

wobei . Dann ist ebenso und

Demnach ist die Kovarianz (und damit die Korrelation) von und gleich genau dann, wenn . Aber und sind nach Definition nicht unabhängig, da immer gleich ist. Daher ist insbesondere nicht multivariat normalverteilt.

Die p-dimensionale Standardnormalverteilung

Dichte der zweidimensionalen Standardnormalverteilung

Das Wahrscheinlichkeitsmaß auf , das durch die Dichtefunktion

definiert wird, heißt Standardnormalverteilung der Dimension . Die -dimensionale Standardnormalverteilung ist abgesehen von Translationen (d. h. Erwartungswert ) die einzige multivariate Verteilung, deren Komponenten stochastisch unabhängig sind und deren Dichte zugleich rotationssymmetrisch ist.

Momente und Kumulanten

Wie im eindimensionalen Fall, sind alle Momente der mehrdimensionalen Normalverteilung durch die ersten beiden Momente definiert. Alle Kumulanten außer den ersten beiden sind 0. Die ersten beiden Kumulanten sind dabei der Mittelwert und die Kovarianz . In Bezug auf das multivariate Momentenproblem hat die Normalverteilung die Eigenschaft, dass sie durch ihre Momente eindeutig definiert ist. Das heißt, wenn alle Momente einer mehrdimensionalen Wahrscheinlichkeitsverteilung existieren und den Momenten einer mehrdimensionalen Normalverteilung entsprechen, ist die Verteilung die eindeutige mehrdimensionale Normalverteilung mit diesen Momenten.[2]

Dichte der zweidimensionalen Normalverteilung

Die Dichtefunktion der zweidimensionalen Normalverteilung mit Mittelwert = (0,0), und Korrelationskoeffizient ist

Jeweils 10.000 Stichproben zweidimensionaler Normalverteilungen mit ρ = −0.8, 0, 0.8 (alle Varianzen sind 1).

Im allgemeineren zweidimensionalen Fall mit Mittelwert = (0,0) und beliebigen Varianzen ist die Dichtefunktion

und den allgemeinsten Fall mit Mittelwert = bekommt man durch Translation (ersetze durch und durch ).

Beispiel für eine mehrdimensionale Normalverteilung

Betrachtet wird eine Apfelbaumplantage mit sehr vielen gleich alten, also vergleichbaren Apfelbäumen. Man interessiert sich für die Merkmale Größe der Apfelbäume, die Zahl der Blätter und die Erträge. Es werden also die Zufallsvariablen definiert:

: Höhe eines Baumes [m]; : Ertrag [100 kg]; : Zahl der Blätter [1000 Stück].

Die Variablen sind jeweils normalverteilt wie

Die meisten Bäume sind also um 4 ± 1 m groß, sehr kleine oder sehr große Bäume sind eher selten. Bei einem großen Baum ist der Ertrag tendenziell größer als bei einem kleinen Baum, aber es gibt natürlich hin und wieder einen großen Baum mit wenig Ertrag. Ertrag und Größe sind korreliert, die Kovarianz beträgt und der Korrelationskoeffizient .

Ebenso ist mit dem Korrelationskoeffizienten , und mit dem Korrelationskoeffizienten .

Fasst man die drei Zufallsvariablen im Zufallsvektor zusammen, ist multivariat normalverteilt. Dies gilt allerdings nicht im Allgemeinen (vgl. Die Randverteilung der mehrdimensionalen Normalverteilung). Im vorliegenden Fall gilt dann für die gemeinsame Verteilung von

und

Die entsprechende Korrelationsmatrix ist

Stichproben bei mehrdimensionalen Verteilungen

In der Realität werden in aller Regel die Verteilungsparameter einer mehrdimensionalen Verteilung nicht bekannt sein. Diese Parameter müssen also geschätzt werden.

Man zieht eine Stichprobe vom Umfang . Jede Realisation des Zufallsvektors könnte man als Punkt in einem -dimensionalen Hyperraum auffassen. Man erhält so die -Datenmatrix als

, wobei

die in jeder Zeile die Koordinaten eines Punktes enthält.

Der Erwartungswertvektor wird geschätzt durch den Mittelwertvektor der arithmetischen Mitteln der Spalten von

mit den Komponenten

.

Für die Schätzung der Kovarianzmatrix erweist sich die bezüglich der arithmetischen Mittelwerte zentrierte Datenmatrix als nützlich. Sie berechnet sich als

,

mit den Elementen , wobei den Einsvektor, einen Spaltenvektor der Länge mit lauter Einsen, darstellt. Es wird also bei allen Einträgen das arithmetische Mittel der zugehörigen Spalte subtrahiert.

Die -Kovarianzmatrix hat die geschätzten Komponenten

.

Sie ergibt sich als

.

Die Korrelationsmatrix wird geschätzt durch die paarweisen Korrelationskoeffizienten

,

auf ihrer Hauptdiagonalen stehen Einsen.

Beispiel zu Stichproben

Es wurden 10 Apfelbäume zufällig ausgewählt und jeweils 3 Eigenschaften gemessen: : Höhe eines Baumes [m]; : Ertrag [100 kg]; : Zahl der Blätter [1000 Stück]. Diese 10 Beobachtungen werden in der Datenmatrix zusammengefasst:

.

Die Mittelwerte berechnen sich, wie beispielhaft an gezeigt, als

.

Sie ergeben den Mittelwertvektor

.

Für die zentrierte Datenmatrix erhält man die zentrierten Beobachtungen, indem von den Spalten der entsprechende Mittelwert abzogen wird:

,

also

.

Man berechnet für die Kovarianzmatrix die Kovarianzen, wie im Beispiel,

und entsprechend die Varianzen

,

so dass sich die Kovarianzmatrix

ergibt.

Entsprechend erhält man für die Korrelationsmatrix zum Beispiel

bzw. insgesamt

Erzeugung mehrdimensionaler, normalverteilter Zufallszahlen

Eine oft verwendete Methode zur Erzeugung eines Zufallsvektors einer -dimensionalen Normalverteilung mit Mittelwertvektor und (symmetrischer und positiv definiter) Kovarianzmatrix kann wie folgt angegeben werden:

  1. Bestimme eine Matrix , so dass . Dazu kann die Cholesky-Zerlegung von oder eine Quadratwurzel von verwendet werden.
  2. Sei ein Vektor, dessen Komponenten stochastisch unabhängige, standardnormalverteilte Zufallszahlen sind. Diese können beispielsweise mit Hilfe der Box-Muller-Methode generiert werden.
  3. Mit der affinen Transformation ergibt sich die gewünschte -dimensionale Normalverteilung.

Anmerkungen

  1. Mehrdimensionale und multivariate Normalverteilung werden in diesem Artikel synonym verwendet. Bei Hartung/Elpelt: Multivariate Statistik haben sie aber (in Kapitel 1, Abschnitt 5) unterschiedliche Bedeutungen: hier ist die multivariate Normalverteilung eine Matrix-Verteilung.
  2. Kleiber, Stoyanov: Multivariate distributions and the moment problem, Journal of Multivariate Analysis, Volume 113, January 2013, Seiten 7–18, doi:10.1016/j.jmva.2011.06.001.

Literatur

  • Mardia, KV, Kent, JT, Bibby, JM: Multivariate Analysis, New York 1979
  • Fahrmeir, Ludwig, Hamerle, Alfred, Tutz, Gerhard (Hrsg.): Multivariate statistische Verfahren, New York 1996
  • Hartung, Joachim, Elpelt, Bärbel: Multivariate Statistik, München, Wien 1999
  • Flury, Bernhard, A first course in multivariate statistics, New York, 1997.