Spannweite, Median, Varianz und Standardabweichung

Im letzten Beitrag hatten wir uns mit den Begriffen Mittelwert, Median und Modalwert beschäftigt. Außerdem haben wir gesehen, wenn der Mittelwert zweier Gruppen gleich groß ist, können die Einzelwerte sehr unterschiedlich verteilt sein, dies nennt man Streuung. Anhand eines Beispiels wird hier leicht verständlich erklärt, welche mathematischen Begriffe in der Statistik hierfür hilfreich sind.

Streuung um den Mittelwert

Beispiel:

In den folgenden Säulendiagrammen ist die Notenverteilung zweier Schülergruppen (Mädchen, Jungen) dargestellt, deren Mittelwert gleich ist.

f_0106

Notenverteilung Mädchen
excel_032
Notenverteilung Jungen
excel_033

Bei den Mädchen liegen die Noten alle sehr nahe am Mittelwert.
Sie streuen wenig um den Mittelwert.
Bei den Jungen sind die Abweichungen vom Mittelwert sehr groß.
Sie streuen stark um den Mittelwert.
Die Statistik bietet Möglichkeiten, die Streuung näher zu untersuchen.




Die Spannweite

Berechnet man den Unterschied zwischen dem größten und kleinsten Beobachtungswert, so erhält man die Spannweite.
Sie ist ein Maß für die Breite des Streubereichs einer Häufigkeitsverteilung.

Definition Spannweite:

f_0107

Beispiel:

f_0108


Der Quartilsabstand

Zur Erinnerung:
Der Median teilt einen nach Größe sortierten Datensatz in der Mitte.
Das bedeutet, links und rechts vom Median liegen gleich viele Beobachtungswerte.

f_0109

Definition Quartile

Unterteilt man die linke und die rechte Hälfte nach gleicher Vorschrift, wie man den Median bestimmt, so erhält man vier gleich große Bereiche, die durch drei Quartile aufgeteilt werden.

Beispiel:

Die Liste enthält von 13 Schülern die Körpergröße.
Die Merkmalsausprägungen (Beobachtungswerte) wurden nach der Größe geordnet.

f_0110

des_021

Quartile:

Etwa 25% aller geordneten Beobachtungswerte sind kleiner als das 1. Quartil.
Etwa 50% aller geordneten Beobachtungswerte sind kleiner als das 2. Quartil.
Etwa 75% aller geordneten Beobachtungswerte sind kleiner als das 3. Quartil.

Wie leicht zu erkennen ist, liegen zwischen dem 1. und 3. Quartiel 50% aller Beobachtungswerte.
Dieser Bereich wird auch Quartilsabstand genannt.

Definition Quartilsabstand

f_0111

Weitere Auswertung des Beispiels:

f_0112

Vergleich zwischen Quartilsabstand und Spannweite

Quartilsabstand Spannweite
Von Ausreißern unabhängig.
Gibt die Breite des mittleren Bereichs an,in dem ca. 50% aller Werte liegen.
Vom kleinsten und größten Wert abhängig.
Gibt die Gesamtbreite an in dem alle Werte liegen.

Beispiel:

Ein Landwirt misst im Monat April jeweils mittags um 12 Uhr die Außentemperatur und trägt sie in eine Tabelle ein.
Berechnen Sie den Mittelwert, die Spannweite und den Median.
Berechnen Sie das 1. und 3. Quartil und den Quartilsabstand.

f_0113

f_0114

Definition Boxplot

Das Wort Box ist englisch und bedeutet Kasten, plot bedeutet zeichnen. Ein Boxplot ist also eine Zeichnung mit einem Kasten. Darin zeichnet man den Median, den größten, kleinsten Wert und und die Quartile.
So kann man gut die Verteilungen vergleichen. Man sieht auf einen Blick, welcher Bereich (welche Spannweite) die Werte haben und ob die Verteilung mehr nach links oder rechts abweichen.

Die Ergebnisse lassen sich in einem Boxplot-Diagramm darstellen:

des_022




Varianz und Standardabweichung

Wir betrachten noch mal die Notenverteilung von Mädchen und Jungen aus dem vorigen Beispiel.

f_0115

Der Mittelwert ist in beiden Fällen gleich, die Streuung um diesen ist unterschiedlich.

des_023

Definition Varianz

f_0116

In der beschreibenden Statistik berechnet man das arithmetische Mittel der Abweichungsquadrate und nennt dieses die Varianz.

Beispiel für die Berechnung der Varianz einer Datenreihe

f_0117

Für unser Beispiel gilt:

f_0118

Viele Daten sind mit Einheiten behaftet, z.B. Meter (m) oder kg.
Die Einheit für die Varianz wäre in diesen Fällen m2 bzw. (kg)2.

Standardabweichung

Um wieder auf die ursprüngliche Einheit zu kommen, zieht man die Wurzel aus der Varianz.
Dieser Wert wird Standardabweichung genannt.

f_0119

Zur praktischen Berechnung fertigt man wie oben gezeigt eine entsprechende Tabelle an.
Sie dient auch zur Kontrolle der Daten.
Die Summe der Abweichungen muss Null ergeben.

Bemerkungen zur Varianz:

f_0120

Berechnung der Standardabweichung aus einer Häufigkeitstabelle

Hier geht man ähnlich vor wie bei der Mittelwertbildung.
Zur Erinnerung:

f_0092

Berechnung der Varianz einer Häufigkeitstabelle.

f_0122

Beispiel:

f_0123

Berechnung der Gesamtzahl aller Schüler aus den absoluten Häufigkeiten ni:

f_0124

Berechnung der Varianz über die absolute Häufigkeit:

f_0125

Beispiel:

f_0126

Berechnung der Varianz über die relative Häufigkeit:

f_0127

Das Beispiel zeigt, dass es sich mit den relativen Häufigkeiten leichter rechnen lässt.

Berechnung der Standardabweichung aus einer klassierten Häufigkeitstabelle

Zur Erinnerung:

f_0095

Berechnung der Varianz einer klassierten Häufigkeitstabelle.

f_0129

Beispiel:

Bestimmen Sie aus der klassierten Häufigkeitstabelle für die Körpergröße die Standardabweichung.

f_0130

Berechnung über die absolute Häufigkeit:

f_0131

Berechnung über die relative Häufigkeit:

f_0132

Auch hier lässt sich das Problem einfacher über die relative Häufigkeit lösen.

Die Standardabweichung ist ein Maß dafür, wie hoch die Aussagekraft des Mittelwertes ist.
Eine kleine Standardabweichung bedeutet, alle Beobachtungswerte liegen nahe am Mittelwert.
Eine große Standardabweichung bedeutet, die Beobachtungswerte sind weit um den Mittelwert gestreut.

des_024

Somit haben wir alles Wichtige aus der Statistik behandelt. Im nächsten Beitrag fasse ich die wichtigsten Begriffe der Statistik noch einmal zusammen.

Alle Formeln zur beschreibenden Statistik sind hier übersichtlich zusammengestellt

Aufgaben hierzu Streumaße I

und Streumaße II

und Statistik vermischte Aufgaben




Gefällt dir die Seite? Dann freuen wir uns über ein like auf facebook
Die Unterrichtsmaterialien gibt es in unserem Shop. Pakete mit vielen PDF-Datei ab 1 Euro und für Lehrer als WORD-Dateien.