Im ersten Beitrag zur Statistik Datenerhebung und Darstellung und in den folgenden, haben wir die verschiedenen Darstellungsarten in der Statistik kennengelernt: Säulendiagramm, Histogramm und Klassenbreite ,und Kreisdiagramm. Im folgenden werden wir sehen, mit welchen mathematischen Methoden die Daten ausgewertet werden können. Als erstes betrachten wir Mittelwert, Median, Modalwert und Varianz.
Mittelwert
Formel: Arithmetisches Mittel einer Datenreihe:
Beispiel:
Bestimmen Sie aus der Liste einer Schülerbefragung die durchschnittliche Körpergröße aller befragten Schüler.
Weitere Beispiele für Mittelwerte:
Durchschnittsabiturnote: 1,8
Durchschnittsgewicht aller Schüler einer Klasse: 62,3 kg
Definition: Median
Der Median (Zentralwert einer Datenreihe) xMed ist derjenige Wert (Merkmalsausprägung), der in der Mitte steht, wenn alle Beobachtungswerte xi der Größe nach geordnet sind.
Wir ordnen alle Werte aus unserem Beispiel der Größe nach und bestimmen die Mitte.
Wie verändern sich Mittelwert und Median, wenn der größte Schüler die Klasse verlässt und für ihn eine kleine Schülerin mit der Körpergröße 150 dazu kommt?
Wie verändert sich der Median, wenn ein Schüler mit der Körpergröße 180 dazu kommt?
Allgemeine Rechenvorschrift zur Berechnung des Median:
Varianz
Die Daten einer Stichprobe können gleichmäßig oder sehr ungleichmäßig verteilt sein, das nennt man Streuung. Ein mathematisches Maß für die Streuung ist die Varianz. Dies betrachten wir wieder anhand unseres Anfangsbeispiels mit dem Mittelwert 167,6 und bilden die Summe der Abweichungen von diesem.
Die Summe bestätigt nur den Mittelwert, sie hat keine Aussagekraft für die Streuung.
Die positiven und negativen Differenzen heben sich auf.
Um die negativen Differenzen zu vermeiden, berechnen wir die Quadrate der Differenzen und bilden davon den Mittelwert.
Formel Varianz
Die Standardabweichung ist ein Maß für die Streuung um den Mittelwert.
Der Modalwert (Modus)
Bei Merkmalsausprägungen wie z.B. „rot, blau, grün“, also bei nominal skalierten Größen kann kein arithmetisches Mittel berechnet werden.
Hier lässt sich lediglich die Frage nach der Merkmalsausprägung mit der größten Häufigkeit stellen.
Beispiel:
Die Fremdsprache englisch kommt mit der größten Häufigkeit vor (84 mal)
Somit ist der Modalwert xMod = englisch.
Definition Modalwert:
Der Modalwert xMod ist der Merkmalswert, der am häufigsten vorkommt.
Bemerkung zum Modalwert:
Gibt es mehrere Merkmalsausprägungen mit der gleichen maximalen Häufigkeit, so existiert kein Modalwert.
Bei einer Klasseneinteilung ist der Modalwert die Mitte der am dichtesten besetzten Klasse.
Die Verwendung des Modus ist bei jedem Skalenniveau möglich.
Ergänzungen zum Median
Beispiel:
Ein Bautrupp mit 9 Personen hat folgende monatliche Einkünfte in Euro.
Dieser Durchschnitt liefert ein falsches Bild, weil die Mehrzahl (7 von 9 Personen) höchstens 1200 € verdient.
Der Wert 6600 € zieht den Mittelwert nach oben.
Man sucht nach einem Wert, der die Verteilung der Einkünfte besser charakterisiert.
Dazu werden die Verdienste der Größe nach sortiert.
Der Median beschreibt die Verteilung besser als der Mittelwert.
Man nennt ihn auch Zentralwert.
Ausreißer haben auf den Median keinen Einfluss.
Berechnung des Medians.
Beispiel 1:
Die Anzahl n der Merkmalsausprägungen ist ungerade, z.B. das Alter von 7 Mathematiklehrern ( n = 7 )
In der Tabelle stehen links und rechts neben dem Median gleich viele Werte.
Beispiel 2:
Die Anzahl der Merkmalsausprägungen ist gerade, z.B. das Alter von 8 Mathematiklehrern ( n = 8 )
Bei einer geraden Anzahl von Werten ( n = 8 ) berechnet man den Median aus den beiden mittleren Werten.
Bemerkungen zum Median:
Falls das betrachtete Merkmal nur ordinal skaliert ist (z.B. Zeugnisnoten), so ist bei geradem n zu beachten dass der Median nur dann existiert, wenn beide infrage kommenden Merkmalsausprägungen gleich sind.
Z.B. bei den Zeugnisnoten 1 2 3 4 5 6 existiert kein Median, denn 3,5 als Zeugnisnote ist nicht üblich.
Aber: 1 2 3 3 4 5 hat den Median 3.
Für den Fall, dass metrische Daten in Klassen gruppiert vorliegen, kann die exakte Mrkmalsausprägung des Medians nicht bestimmt werden.
Arithmetisches Mittel aus einer Häufigkeitstabelle
Berechnung des arithmetischen Mittels aus einer Häufigkeitstabelle
Beispiel:
Das Ergebnis einer Vergleichsarbeit ist untenstehender Tabelle zu entnehmen.
Berechnen Sie den Notendurchschnitt.
Häufigkeitstabelle
Arithmetisches Mittel bei klassierten Daten
Berechnung des Mittelwertes bei klassierten Daten:
Beispiel:
Bestimmen Sie aus der klassierten Häufigkeitstabelle für das Körpergewicht den arithmetischen Mittelwert.
Der Häufigkeit wird die Klassenmitte zugeordnet.
Man geht davon aus, dass alle 10 Schüler der Klasse x2 das Körpergewicht 65,5 kg haben.
Eigenschaften von Lagemaßen
Vergleich von Lagemaßen anhand eines Säulendiagramms:
Die Noten werden in diesem Beispiel metrisch skaliert, dh. es soll auch Zwischennoten geben.
Häufigkeitstabelle:
Lagemaße im Säulendiagramm eingezeichnet:
Das Stängel – Blatt – Diagramm
Zur Bestimmung des Medians müssen die Daten (Merkmalsausprägungen) geordnet werden.
Das kann mühsam sein. Eine Erleichterung bietet hier das Stängel – Blatt – Diagramm.
Beispiel:
Die Daten einer Urliste lauten:
Die Daten werden im Stängel – Blatt – Diagramm geordnet.
Die Daten werden nach den Stängeln (Zehnerzahlen) geordnet.
Zu jedem Stängel werden dann die Blätter (Einerzahlen) der Größe nach hinzugeschrieben.
Die meisten Daten liegen im 2. Stängel.
Der Wert der größten Häufigkeit (Modalwert) ist xMod = 60
An der 14. Stelle steht der Median xMed = 63
Im nächsten Beitrag werden wir das Thema Standardabweichung und Varianz vertiefen. Außerdem die mathematischen Begriffe Spannweite und Quartilsabstand kennen lernen.
Aufgaben hierzu I
und Mittelwert und Median II