„Diskussion:Streuungsmaß (Statistik)“ – Versionsunterschied

Inhalt gelöscht Inhalt hinzugefügt
Zeile 68: Zeile 68:
::Um welche konkreten Messpunkte das Intervall "50% der Messpunkte" gezeichnet ist, ist nicht erklärt. Zwar liegen 5/10 der Messpunkte in diesem Intervall. Das gleiche würde jedoch für ein Intervall gelten, welches die ersten 5 Punkte von links überdecken würde... von daher würde ich dieses komische Intervall entfernen, oder explizit darauf verweisen, wie es konstruiert ist. [[Benutzer:Biggerj1|biggerj1]] ([[Benutzer Diskussion:Biggerj1|Diskussion]]) 19:18, 21. Mai 2024 (CEST)
::Um welche konkreten Messpunkte das Intervall "50% der Messpunkte" gezeichnet ist, ist nicht erklärt. Zwar liegen 5/10 der Messpunkte in diesem Intervall. Das gleiche würde jedoch für ein Intervall gelten, welches die ersten 5 Punkte von links überdecken würde... von daher würde ich dieses komische Intervall entfernen, oder explizit darauf verweisen, wie es konstruiert ist. [[Benutzer:Biggerj1|biggerj1]] ([[Benutzer Diskussion:Biggerj1|Diskussion]]) 19:18, 21. Mai 2024 (CEST)
::In der deskriptiven Statistik gibt es Beobachtungswerte (Physiker würden von Messwerten sprechen, es gibt aber allgemeinere Beobachtungen). Es gibt ''keine'' Wahrscheinlichkeitsverteilung aus der die Daten in irgendeinem Sinn kommen und die Beobachtungen müssen auch keine Stichprobenwerte sein. Sie können z. B. Werte irgendeiner Gesamtheit sein. REs gibt in der deskriptiven Statistik keine Stichprobenrealisierungen. Das ist vielmehr der Ausgangspunkt der induktiven Statistik, in der man von Stichprobenwerten auf Kennwerte irgendwelcher Grundgesamtheiten oder Wahrscheinlichkeitsverteilungen zurückschliessen will. --[[Benutzer:Sigma^2|Sigma^2]] ([[Benutzer Diskussion:Sigma^2|Diskussion]]) 20:10, 21. Mai 2024 (CEST)
::In der deskriptiven Statistik gibt es Beobachtungswerte (Physiker würden von Messwerten sprechen, es gibt aber allgemeinere Beobachtungen). Es gibt ''keine'' Wahrscheinlichkeitsverteilung aus der die Daten in irgendeinem Sinn kommen und die Beobachtungen müssen auch keine Stichprobenwerte sein. Sie können z. B. Werte irgendeiner Gesamtheit sein. REs gibt in der deskriptiven Statistik keine Stichprobenrealisierungen. Das ist vielmehr der Ausgangspunkt der induktiven Statistik, in der man von Stichprobenwerten auf Kennwerte irgendwelcher Grundgesamtheiten oder Wahrscheinlichkeitsverteilungen zurückschliessen will. --[[Benutzer:Sigma^2|Sigma^2]] ([[Benutzer Diskussion:Sigma^2|Diskussion]]) 20:10, 21. Mai 2024 (CEST)
::Vielen Dank für die konstruktive Kritik. Tatsächlich habe ich auf der X-Achse die als Stern eingezeichneten Messwerte derart platziert, dass der Überlapp des Kerndichtenschätzers zur dargestellten Verteilung maximiert wird.
::Die Bezeichnung "Häufigkeit" resultiert daher, dass ich in anderer Version ein Histogramm hinterlegte und eine doppelte y-Achse vermeiden wollte. Dadurch war die Normierung nicht zu 1 gegeben, was mich von der Begrifflichkeit der Wahrscheinlichkeitsverteilung etwas abschreckte.
::Bezüglich der "50% der Messwerte": Dies muss im Kontext der beidseits zugehörigen Quartilen betrachtet werden: Damit ist das Intervall bis auf eine Verschiebung um einen einzelnen Messwert klar definiert.
::Insgesamt ist die zusätzliche Bebilderung meinem Ansinnen geschuldet, auch Leser mit geringerem fachlichen Verständnis abzuholen.
::Die Grafik ist mit Wolfram Mathematica erstellt, das wohl nicht jedem zugänglich ist - entsprechende Änderungswünsche kann ich gerne einpflegen, sobald ein Konsens gefunden ist.
::Ist eine detaillierte Beschreibung der Methodik in der Bildbeschreibung selbst sinnvoll oder eine Erweiterung des Artikel-Textes? --[[Benutzer:Dr.rer.nat. Rudolf Golubich|Dr.rer.nat. Rudolf Golubich]] ([[Benutzer Diskussion:Dr.rer.nat. Rudolf Golubich|Diskussion]]) 20:10, 21. Mai 2024 (CEST)

Version vom 21. Mai 2024, 20:10 Uhr

Zum Archiv
Wie wird ein Archiv angelegt?
Auf dieser Seite werden Abschnitte ab Überschriftenebene 2 automatisch archiviert, die seit 7 Tagen mit dem Baustein {{Erledigt|1=--~~~~}} versehen sind.

Graphische Darstellung

Sind grafische Darstellungen hier angebracht?

absolut! -- kakau 10:17, 28. Mai 2004 (CEST)Beantworten

Ich habe die Beschreibung des Boxplots entfernt und den zu diesem Thema exestierenden Artikel verlinkt. Ark0n 00:06, 28. Jun 2005 (CEST)

Dieser Abschnitt kann archiviert werden. --Sigma^2 (Diskussion) 11:15, 25. Aug. 2023 (CEST)

Streuung, Varianz, Dispersion

sind die Begriffe Streuung, Varianz und Dispersion äquivalent? ferner: Steuungsmaß = Dispersionsgröße? --143.50.168.42 16:23, 23. Okt 2005 (CEST)

Dieser Abschnitt kann archiviert werden. --Sigma^2 (Diskussion) 17:55, 21. Mai 2024 (CEST)

Quartil oder Quantil

heisst es jetzt quartiel oder quantiel? Weil einmal steht hier Quartielabstand und dann Quantielabstand.

K-egg 10:10, 16. Nov 2005 (CET)
es muss Quartiel heissen K-egg 10:22, 2. Dez 2005 (CET)
Das Quartiel ist eine Unterart von Quantielen. Ein Quantiel ist irgendein bestimmter Anteil von Messwerten, ein Quartiel sind 25 % der Messwerte. --217.82.99.69 15:04, 4. Sep. 2008 (CEST)Beantworten
Ob Quartiel oder Quantiel, Hauptsache mit Stiel. -- Philipendula 18:53, 4. Sep. 2008 (CEST)Beantworten
Nein, ein p-Quantil ist kein "Anteil von Messwerten", sondern eine Zahl, durch die die Messwerte in zwei Anteile mit (im Idealfall) den relativen Häufigkeiten p und 1-p aufgeteilt werden. Quartile sind die drei (!) p-Quantile für . Durch die drei Quartile werden die Messwerte in vier Gruppen aufgeteilt. Diese vier Gruppen werden von Anwendern nicht selten fälschlich als Quartile bezeichnet. --Sigma^2 (Diskussion) 11:08, 25. Aug. 2023 (CEST)Beantworten

MAD und Standardabweichung

ich habe die Umrechnung zwischen MAD und Standardabweichung für MADs aus dem Median der absoluten Abweichungen ergänzt. Ich bin mit meinen Erläuterungen dazu etwas unzufrieden und würde mich freuen, wenn sie von jemandem überarbeitet würden die/der mehr davon versteht. --Rick Schroeder 21:15, 8. Mär 2006 (CET)

Meines erachtens heißt MAD median absolute deviation und wird auch so in der englischsprachigen Literatur gebraucht. Ich bin mir über die genaue Bedeutung von "medium absolute deviation" nicht im klaren, einem kurzen Google-Battle nach zu urteilen scheint diese Bezeichnung auch nicht sehr gebräuchlich zu sein. Meiner Meinung nach sollte man MAD also als "median ..." einführen, dessen Eigenschaften aufführen und evtl. herleiten ( was ich gerne übernehmen kann ) um dann anschließend eine kurze Bemerkung über den "medium..." zu erwähnen. Die momentena Priorität im Artikel gefällt mir so nicht. --Spring-Daniel 13:04, 21. Mär 2006 (CET)

Ich habe den Artikel nun so umgeschrieben das ich denke das der Unterschied zwischen MD und MAD und die Beziehungen zur Standardabweichung nachvollziehbarer sind. Ausserdem hab ich herausgestellt das die MD kein robuster Schätzer ist ( In der vorherigen Version war dazu eine nach meiner Meinung widersprüchliche Aussagen zu finden, zum einen die MD sei robuster als die Standardabweichung, zum anderen wird 2 Sätze später erwähnt das'die Mittelung auch wieder anfällig gegenüber Ausreißern in den Daten ist.'). Beim Zusammenhang zwischen MD und Standardabweichung bin ich mir nicht 100%ig sicher ob er stimmt, bei meinen Berechnungen bin ich auf gekommen. Wäre schön wenn das noch jemand nachrechnen könnte. --Spring-Daniel 10:36, 24. Mär 2006 (CET)

Dieser Abschnitt kann archiviert werden. --Sigma^2 (Diskussion) 17:57, 21. Mai 2024 (CEST)

Definitionsklärung mittlere Abweichung / mittlere absolute Abweichung

Laut Schwarze "Grundlagen der Statistik I" und vielen anderen Quellen im Internet (zum Beispiel http://webrum.uni-mannheim.de/vwl/mschienl/folien3.pdf#search=%22mittlere%20absolute%20abweichung%22) ist die "Mittlere Absolute Abweichung" das, was im Artikel als "Mittlere Abweichung" bezeichnet wird (das arithemtische Mittel der absoluten Abweichungen einzelner Beobachtungswerte vom Median). Was ist die Quelle für die Definition im Artikel für "Mittlere Abweichung" und "Mittlere absolute Abweichung"? Dazu habe ich bislang nur http://mathworld.wolfram.com/MeanDeviation.html gefunden. Dort ist "Mean Deviation" als das definiert, was hier im Artikel "Mittlere Abweichung" heißt, die Übersetzung wäre dann "mittlere Abweichung", die allerdings in der Bedeutung im Deutschen nicht gebräuchlich zu sein scheint. Allerdings kann ich die dortige Definition "Mean Absolute Deviation" wiederum in diesem Artikel nicht wiederfinden. -- Man 11:19, 11. Okt. 2006 (CEST)Beantworten

Ergänzung: Der MedMed wird wohl im Allgemeinen als "Median der absoluten Abweichungen vom (Stichproben–) Median" bezeichnet, und nicht, wie hier angegeben, als mittlere absolute Abweichung, siehe zum Beispiel http://www.statistik.tuwien.ac.at/public/dutt/vorles/inf_bak/node23.html oder http://www.boku.ac.at/statedv/statlbt/St1_Folie_2_4K.pdf. Falls keiner Einwände hat, korrigiere ich das demnächst. -- Man 11:00, 16. Okt. 2006 (CEST)Beantworten

Bei der Berechnung der en:mean absolute deviation (MAD) werden im Englischen nicht die Beträge der Abweichungen vom Median, sondern die Beträge der Abweichungen vom arithmetischen Mittelwert gemittelt. (The mean absolute deviation is the average absolute deviation from the mean ..., siehe auch hier oder hier) Was wir momentan haben, haut nicht hin. -- Jayen466 18:32, 12. Feb. 2008 (CET)Beantworten
Habe MAD als alternative Bez. für MedMed entfernt und dafür im Absatz darüber eingefügt. -- Jayen466 18:40, 12. Feb. 2008 (CET)Beantworten
Dieser Abschnitt kann archiviert werden. --Sigma^2 (Diskussion) 19:43, 21. Mai 2024 (CEST)

Mittlere absolute Differenz fehlt

Die mittlere absolute Differenz fehlt noch (siehe z.B. [1], Def 1.27). Sie steht mit dem Gini-Koeffizient in Zusammenhang. --Bertrus 14:09, 26. Jan. 2009 (CET)Beantworten

Wahrscheinlichkeitstheorie raus

Ich würde gerne den Wahrscheinlichkeitstheoretischen teil entfernen, also nurnoch Streuungsmaße von Stichproben und nichtmehr von Zufallsvariablen behandeln. Das erhöht die Lesbarkeit und hilft die Unterschiede gleichlautender Begriffe klarer zu erkennen. Außerdem sind die Wahrscheinlichkeitstheoretischen Streuungsmaße unter Dispersionsmaß (Stochastik) abgehandelt. Gibt es Meinungen? --NikelsenH (Diskussion) 22:26, 26. Apr. 2017 (CEST)Beantworten

Ja, dass wäre sehr vernünftig, es entweder rauszunehmen, oder klarzustellen, dass es nur eine Parallele ist.--Sigma^2 (Diskussion) 10:57, 25. Aug. 2023 (CEST)Beantworten
Ich habe die Konzepte der Wahrscheinlichkeitstheorie jetzt zunächst in einem eigenen Abschnitt gesammelt. Was damit passiert, hängt davon ab, was schon in anderen Artikeln steht und was noch von den früheren Autoren an Belegen für mehrere unbelegte Aussagen beigebracht wird. --Sigma^2 (Diskussion) 13:06, 25. Aug. 2023 (CEST)Beantworten

Deskriptive versus induktive Statistik

Zunächst erhebt der Artikel zwar den Anspruch, etwas zur deskriptiven Statistik beizutragen, gleitet aber ständig in die induktive Statistik ab. Bereits in der Einleitung steht etwas von Stichprobe, ein Kernbegriff der induktiven Statistik. Beschreibende (deskriptive) Statistik kann auf Stichprobenwerte, aber auch auf andere Messwerte und Werte beliebiger (Grund)-Gesamtheiten angewendet werden. Die aus der induktiven Statistiken stammenden Formeln werden hier als Varianten dargestellt, sie haben aber nichts mit beschreibender Statistik zu tun, sondern sind Korrekturen für den Spezialfall, dass in der induktiven Statistik ein unbekannter Parameter aus der Grundgesamtheit mit einer statistischen Kennzahl der Stichprobe geschätzt werden soll. Leider zieht sich diese Konfusion durch viele Wikipedia-Artikel zur Statistik.--Sigma^2 (Diskussion) 11:32, 25. Aug. 2023 (CEST)Beantworten

Schlechte Graphik

Zu gegebenen Messwerten sind in einer zugehörige Wahrscheinlichkeitsverteilung verschiedene Streumaße eingezeichnet. Die Spannweite bezeichnet den Abstand zwischen maximalem und minimalem Messwert. Im Intervall des Interquartilsabstands liegt die Hälfte der Messwerten, wobei ein Viertel sowohl unterhalb als auch oberhalb zu liegen kommt. Die Standardabweichung überdeckt in der Wahrscheinlichkeitsverteilung eine Fläche von 0.682.

Die mit dem letzten - noch nicht gesichteten Edit (Stand 21.5.2024) – eingefügte nebenstehende Graphik ist eine seltsame Mischung aus Elementen der deskriptiven Statistik, der induktiven Statistik und der Wahrscheinlichkeitstheorie (aus der Normalverteilung abgeleitete Dichtefunktion und Wahrscheinlichkeiten) und sollte in dieser Form nicht in den Artikel.--Sigma^2 (Diskussion) 18:07, 21. Mai 2024 (CEST)Beantworten

Meine Interpretation der Grafik ist: aus der gezeigten Wahrscheinlichkeitsdichte sind Stichproben entnommen, welche auf der x-Achse explizit als Punkte eingezeichnet sind. Die Verteilung hat einen Median, Quantile, eine Standandabweichung... Die konkrete Stichprobenrealisierung hat ein Min, Max-Wert und daher eine "Spannweite". (Diesen Begriff kannte ich nicht...)
Konkret würde ich vorschlagen die Y-Achse mir Wahrscheinlichkeitsdichte anstatt "Häufigkeit" zu benennen.
Die gemeinsame Darstellung einer Stichprobenrealisierung und der Wahrscheinlichkeitsdichte, der sie entstammt, finde ich nicht verwerflich. Dafür finden sich sicher Vorbilder in Büchern. Übersehe ich sonst eine Schwäche? biggerj1 (Diskussion) 19:13, 21. Mai 2024 (CEST)Beantworten
Um welche konkreten Messpunkte das Intervall "50% der Messpunkte" gezeichnet ist, ist nicht erklärt. Zwar liegen 5/10 der Messpunkte in diesem Intervall. Das gleiche würde jedoch für ein Intervall gelten, welches die ersten 5 Punkte von links überdecken würde... von daher würde ich dieses komische Intervall entfernen, oder explizit darauf verweisen, wie es konstruiert ist. biggerj1 (Diskussion) 19:18, 21. Mai 2024 (CEST)Beantworten
In der deskriptiven Statistik gibt es Beobachtungswerte (Physiker würden von Messwerten sprechen, es gibt aber allgemeinere Beobachtungen). Es gibt keine Wahrscheinlichkeitsverteilung aus der die Daten in irgendeinem Sinn kommen und die Beobachtungen müssen auch keine Stichprobenwerte sein. Sie können z. B. Werte irgendeiner Gesamtheit sein. REs gibt in der deskriptiven Statistik keine Stichprobenrealisierungen. Das ist vielmehr der Ausgangspunkt der induktiven Statistik, in der man von Stichprobenwerten auf Kennwerte irgendwelcher Grundgesamtheiten oder Wahrscheinlichkeitsverteilungen zurückschliessen will. --Sigma^2 (Diskussion) 20:10, 21. Mai 2024 (CEST)Beantworten
Vielen Dank für die konstruktive Kritik. Tatsächlich habe ich auf der X-Achse die als Stern eingezeichneten Messwerte derart platziert, dass der Überlapp des Kerndichtenschätzers zur dargestellten Verteilung maximiert wird.
Die Bezeichnung "Häufigkeit" resultiert daher, dass ich in anderer Version ein Histogramm hinterlegte und eine doppelte y-Achse vermeiden wollte. Dadurch war die Normierung nicht zu 1 gegeben, was mich von der Begrifflichkeit der Wahrscheinlichkeitsverteilung etwas abschreckte.
Bezüglich der "50% der Messwerte": Dies muss im Kontext der beidseits zugehörigen Quartilen betrachtet werden: Damit ist das Intervall bis auf eine Verschiebung um einen einzelnen Messwert klar definiert.
Insgesamt ist die zusätzliche Bebilderung meinem Ansinnen geschuldet, auch Leser mit geringerem fachlichen Verständnis abzuholen.
Die Grafik ist mit Wolfram Mathematica erstellt, das wohl nicht jedem zugänglich ist - entsprechende Änderungswünsche kann ich gerne einpflegen, sobald ein Konsens gefunden ist.
Ist eine detaillierte Beschreibung der Methodik in der Bildbeschreibung selbst sinnvoll oder eine Erweiterung des Artikel-Textes? --Dr.rer.nat. Rudolf Golubich (Diskussion) 20:10, 21. Mai 2024 (CEST)Beantworten