Das Kefk Network Wiki befindet sich im Testbetrieb.


Streuung (Statistik)

Aus Kefk.

Wechseln zu: Navigation, Suche

Unter Streuung fasst man in der deskriptiven Statistik verschiedene Maßzahlen zusammen, die der Einschätzung der Streubreite von Stichprobenwerten um ihren Mittelwert dienen. Die verschiedenen Berechnungsmethoden unterscheiden sich prinzipiell durch ihre Beeinflussbarkeit bzw. Empfindlichkeit gegenüber Ausreißern. Die Streuung der Stichprobenverteilung wird als Standardfehler bezeichnet.

Inhaltsverzeichnis

Maßzahlen

Spannweite (range)

Die Spannweite ist das einfachste Streuungsmaß und berechnet sich einfach als Distanz zwischen dem größten und dem kleinsten Messwert:

R = xmaxxmin

R ist aufgrund der Tatsache, dass - unabhängig von der Stichprobengröße - nur zwei Werte (die so genannten Extremwerte) berücksichtigt werden, nicht robust gegenüber Ausreißern.

(Inter-)Quartilabstand ((inter-)quartile range)

Hat man die Quartile Q25 und Q75 berechnet, so bezeichnet man deren Differenz als Quartilabstand oder QR:

QR = Q75Q25

Innerhalb des QR liegen 50% aller Messwerte. Er ist - wie auch der Median bzw Q50 - unempfindlich gegenüber Ausreißern. Es lässt sich zeigen dass er einen Bruchpunkt von ε * = 0.25 hat.

Mittlere Abweichung (engl.: mean deviation from the median, MD )

Die mittlere Abweichung MD vom Median \tilde{x} ist definiert durch


\mathit{MD} = E\left|X - \tilde{x}\right|

Im Falle einer konkreten Stichprobe wird sie errechnet durch


\mathit{MD} = \frac{1}{n}\sum_i \left|x_i - \tilde{x}\right|

Durch die Definition ergibt sich im Falle von normalverteilten Daten folgender Zusammenhang zur Standardabweichung:

\mathit{MD} = \sqrt{\frac{2}{\pi}} \cdot \sigma

Wahlweise kann man statt des Median auch andere Mittelwerte, wie zum Beispiel das arithmetische Mittel, verwenden, man spricht hierbei dann von mean deviation from the mean. Die Vermutung, dass der Schätzer aufgrund der Verwendung des Medians robust wäre, trifft nicht zu. In beiden Fällen hat die MD einen Bruchpunkt von \varepsilon^*=0

Mittlere absolute Abweichung (auch: MedMed, engl.: median absolute deviation, MAD)

Die mittlere absolute Abweichung MAD ist definiert durch


P(\left|X - \tilde{x}\right| \leq \mathit{MAD}) = 0.5

Im Falle einer konkreten Stichprobe wird sie errechnet durch


\mathit{MAD} = \mathit{median}{\left|x_i - \tilde{x}\right|}

Durch die Definition ergibt sich im Falle von normalverteilten Daten folgender Zusammenhang zur Standardabweichung:

\mathit{MAD} = z_{0.75} \cdot \sigma

z0.75 ist das 0.75-Quantil der Standardnormalverteilung und beträgt ca. 0,6745.

Die mittlere absolute Abweichung ist ein robuster Schätzer für die Standardabweichung. Es lässt sich zeigen dass sie einen Bruchpunkt von \varepsilon^*=0.5 hat.

Varianz und Standardabweichung (engl.: variance bzw. standard deviation)

Siehe auch: Varianz, Standardabweichung.

Gleitende Streuung (engl.: moving range)

Bild:Qsicon Lücke.png Dieser Artikel oder Abschnitt weist inhaltliche Lücken auf.

Hilf Kefk, indem du die fehlenden Informationen recherchierst und einfügst!

Graphische Darstellungsformen


siehe auch

Momente einer Verteilung, Homoskedastizität

Wikipedia
Dieses Dokument entstammt in seiner ersten oder einer späteren Version der deutschsprachigen Wikipedia. Es ist dort zu finden unter dem Stichwort Streuung_%28Statistik%29, die Liste der bisherigen Autoren befindet sich in der Versionsliste; die Originalfassung kann dort auch bearbeitet werden. Alle Texte der Wikipedia und ihre Derivate stehen unter der GNU-Lizenz für freie Dokumentation.
Persönliche Werkzeuge
Andere Sprachen