Mittelwert, Median und Modalwert berechnen
Im ersten Beitrag zur Statistik Datenerhebung und Darstellung und in den folgenden, haben wir die verschiedenen Darstellungsarten in der Statistik kennengelernt: Säulendiagramm, Histogramm und Klassenbreite ,und Kreisdiagramm. Im folgenden werden wir sehen, mit welchen mathematischen Methoden die Daten ausgewertet werden können. Zuerst stelle ich die Formel zur Berechnung des arithmetischen Mittels einer Datenreihe vor. Danach stelle ich eine allgemeine Rechenvorschrift zur Berechnung des Medians vor und zeige, wie man die Varianz berechnet. Anschließend erkläre ich, was der Modalwert (Modus) ist anhand eines einfachen Beispiels. Dann zeige ich, wie man das arithmetisches Mittel in einer Häufigkeitstabelle erkennt und die Berechnung des Mittelwertes bei klassierten Daten. Schließlich zeige ich, wie man die Daten in einem Stängel-Blatt-Diagramm ordnen kann.
Formel: Arithmetisches Mittel einer Datenreihe:
Beispiel:
Bestimmen Sie aus der Liste einer Schülerbefragung die durchschnittliche Körpergröße aller befragten Schüler.
Weitere Beispiele für Mittelwerte:
Durchschnittsabiturnote: 1,8
Durchschnittsgewicht aller Schüler einer Klasse: 62,3 kg
Definition: Median
Der Median (Zentralwert einer Datenreihe) xMed ist derjenige Wert (Merkmalsausprägung), der in der Mitte steht, wenn alle Beobachtungswerte xi der Größe nach geordnet sind.
Wir ordnen alle Werte aus unserem Beispiel der Größe nach und bestimmen die Mitte.
Wie verändern sich Mittelwert und Median, wenn der größte Schüler die Klasse verlässt und für ihn eine kleine Schülerin mit der Körpergröße 150 dazu kommt?
Wie verändert sich der Median, wenn ein Schüler mit der Körpergröße 180 dazu kommt?
Allgemeine Rechenvorschrift zur Berechnung des Median:
Varianz berechnen
Die Daten einer Stichprobe können gleichmäßig oder sehr ungleichmäßig verteilt sein, das nennt man Streuung. Ein mathematisches Maß für die Streuung ist die Varianz. Dies betrachten wir wieder anhand unseres Anfangsbeispiels mit dem Mittelwert 167,6 und bilden die Summe der Abweichungen von diesem.
Die Summe bestätigt nur den Mittelwert, sie hat keine Aussagekraft für die Streuung.
Die positiven und negativen Differenzen heben sich auf.
Um die negativen Differenzen zu vermeiden, berechnen wir die Quadrate der Differenzen und bilden davon den Mittelwert.
Varianz-Formel
Die Standardabweichung ist ein Maß für die Streuung um den Mittelwert.
Der Modalwert (Modus)
Bei Merkmalsausprägungen wie z.B. „rot, blau, grün“, also bei nominal skalierten Größen kann kein arithmetisches Mittel berechnet werden.
Hier lässt sich lediglich die Frage nach der Merkmalsausprägung mit der größten Häufigkeit stellen.
Beispiel:
Die Fremdsprache englisch kommt mit der größten Häufigkeit vor (84 mal)
Somit ist der Modalwert xMod = englisch.
Definition Modalwert:
Der Modalwert xMod ist der Merkmalswert, der am häufigsten vorkommt.
Bemerkung zum Modalwert:
Gibt es mehrere Merkmalsausprägungen mit der gleichen maximalen Häufigkeit, so existiert kein Modalwert.
Bei einer Klasseneinteilung ist der Modalwert die Mitte der am dichtesten besetzten Klasse.
Die Verwendung des Modus ist bei jedem Skalenniveau möglich.
Ergänzungen zum Median
Beispiel:
Ein Bautrupp mit 9 Personen hat folgende monatliche Einkünfte in Euro.
Dieser Durchschnitt liefert ein falsches Bild, weil die Mehrzahl (7 von 9 Personen) höchstens 1200 € verdient.
Der Wert 6600 € zieht den Mittelwert nach oben.
Man sucht nach einem Wert, der die Verteilung der Einkünfte besser charakterisiert.
Dazu werden die Verdienste der Größe nach sortiert.
Der Median beschreibt die Verteilung besser als der Mittelwert.
Man nennt ihn auch Zentralwert.
Ausreißer haben auf den Median keinen Einfluss.
Berechnung des Medians anhand von Beispiel 1:
Die Anzahl n der Merkmalsausprägungen ist ungerade, z.B. das Alter von 7 Mathematiklehrern ( n = 7 )
In der Tabelle stehen links und rechts neben dem Median gleich viele Werte.
Beispiel 2:
Die Anzahl der Merkmalsausprägungen ist gerade, z.B. das Alter von 8 Mathematiklehrern ( n = 8 )
Bei einer geraden Anzahl von Werten ( n = 8 ) berechnet man den Median aus den beiden mittleren Werten.
Bemerkungen zum Median:
Falls das betrachtete Merkmal nur ordinal skaliert ist (z.B. Zeugnisnoten), so ist bei geradem n zu beachten dass der Median nur dann existiert, wenn beide infrage kommenden Merkmalsausprägungen gleich sind.
Z.B. bei den Zeugnisnoten 1 2 3 4 5 6 existiert kein Median, denn 3,5 als Zeugnisnote ist nicht üblich.
Aber: 1 2 3 3 4 5 hat den Median 3.
Für den Fall, dass metrische Daten in Klassen gruppiert vorliegen, kann die exakte Mrkmalsausprägung des Medians nicht bestimmt werden.
Arithmetisches Mittel aus einer Häufigkeitstabelle
Berechnung des arithmetischen Mittels aus einer Häufigkeitstabelle
Beispiel:
Das Ergebnis einer Vergleichsarbeit ist untenstehender Tabelle zu entnehmen.
Berechnen Sie den Notendurchschnitt.
Häufigkeitstabelle
Arithmetisches Mittel bei klassierten Daten
Berechnung des Mittelwertes bei klassierten Daten:
Beispiel:
Bestimmen Sie aus der klassierten Häufigkeitstabelle für das Körpergewicht den arithmetischen Mittelwert.
Der Häufigkeit wird die Klassenmitte zugeordnet.
Man geht davon aus, dass alle 10 Schüler der Klasse x2 das Körpergewicht 65,5 kg haben.
Eigenschaften von Lagemaßen
Vergleich von Lagemaßen anhand eines Säulendiagramms:
Die Noten werden in diesem Beispiel metrisch skaliert, dh. es soll auch Zwischennoten geben.
Häufigkeitstabelle:
Lagemaße im Säulendiagramm eingezeichnet:
Das Stängel-Blatt-Diagramm
Zur Bestimmung des Medians müssen die Daten (Merkmalsausprägungen) geordnet werden.
Das kann mühsam sein. Eine Erleichterung bietet hier das Stängel-Blatt-Diagramm.
Beispiel:
Zuerst sammeln wir die Daten in einer Urliste:
Danach ordenen wir sie im Stängel-Blatt-Diagramm:
Die Daten werden nach den Stängeln (Zehnerzahlen) geordnet.
Zu jedem Stängel werden dann die Blätter (Einerzahlen) der Größe nach hinzugeschrieben.
Die meisten Daten liegen im 2. Stängel.
Der Wert der größten Häufigkeit (Modalwert) ist xMod = 60
An der 14. Stelle steht der Median xMed = 63
Im nächsten Beitrag werden wir das Thema Standardabweichung und Varianz vertiefen. Außerdem die mathematischen Begriffe Spannweite und Quartilsabstand kennen lernen.
Hier finden Sie die Aufgaben hierzu I
und Mittelwert und Median II.
Alle Formeln zur beschreibenden Statistik sind hier übersichtlich zusammengestellt.
Hier finden Sie eine Übersicht über alle Beiträge zum Thema Statistik, dort auch Links zu weiteren Aufgaben.
Diese und weitere Unterrichtsmaterialien können Sie in unserem Shop kaufen. Dort finden Lehrer WORD-Dateien, die sie beliebig ändern können. Außerdem können Sie alle Materialien kostenlos als PFD-Dateien herunterladen.