Modalwert, Mittelwert und Median


In diesem Beitrag erkläre ich leicht verständlich, wie man Median, Modalwert und das arithmetisches Mittel einer Häufigkeitstabelle berechnet. Dazu stelle ich viele Beispiele vor.

In den bisherigen Beiträgen zur Statistik ging es um Datenerhebung und Darstellung. Im folgenden werden wir sehen, mit welchen mathematischen Methoden man die Daten analysieren kann. Als erstes geht es darum, welche Daten in der Mitte liegen. Man nennt diese Methoden auch Lagemaße. Ich erkläre das arithmetische Mittel auf für Häufigkeitstabellen, den Median und den Modalwert. Dabei stelle ich die Formeln vor und gebe viele Beispiele. Danach Vergleiche ich Mittelwert, Median und Modalwert.

  1. Arithmetisches Mittel
  2. Median
  3. Modalwert (Modus) 
  4. Vergleich Mittelwert, Median, Modalwert
  5. Daten in einem Stängel-Blatt-Diagramm ordnen
  6. Link zu Aufgaben

1. Arithmetisches Mittel

Das arithmetische Mittel wird auch Durchschnitt genannt. Das kennst du sicherlich. In der Statistik unterscheidet man verschiedene:

Formel: Arithmetisches Mittel einer Datenreihe:

Dabei bilden wir die Summe aus allen Beobachtungswerten. Danach teilen wir die Summe durch die Anzahl der Beobachtungswerte.

f_0089

Beispiel:

Hier die Körpergröße aller Schüler einer Klasse. Bilde daraus den Durchschnitt!

f_0088

Weitere Mittelwerte sind z. B. Durchschnittsnote: 1,8, Durchschnittsalter.

Arithmetisches Mittel aus einer Häufigkeitstabelle

Oben haben wir das arithmetische einer Datenreihe berechnet. Dazu brauchten wir nur alle Werte addieren und durch deren Anzahl zu dividieren. Denn bei einer Datenreihe steht uns jeder einzelne Beobachtungswert zur Verfügung. Z. b. die Körpergröße jedes einzelnen Schülers. Bei einer Häufigkeitstabelle haben wir nur die Anzahl, wie oft eine Merkmalsausprägung vorkommt. Z. B. haben 5 Schüler die Note 1 erhalten.

Beispiel:

Häufigkeitstabelle
f_0090

f_0091

Deshalb multiplizieren wir jede Note mit deren Anzahl. Z. B. haben 8 Schüler eine 2 geschrieben. Also 8 mal 2. Zweitens addieren wir alle Werte der Faktoren. In unserem Beispiele ergibt die Summe 164. Schließlich dividieren wir durch die Anzahl der Klassenarbeiten, hier 50. Das arithmetische Mittel dieser Häufigkeitstabelle beträgt also 3,28.

Man mit der absoluten Häufigkeit rechnen, also der Anzahl der Schüler. Z. B. 5 Schüler haben eine 1 geschrieben. Aber auch mit der relativen Häufigkeit, z. B. ein Zehntel der Schüler haben eine 1 geschrieben. Also 0,1 Schüler.

Hierzu beide Formeln:

f_0092

Berechnung des Arithmetischen Mittels bei klassierten Daten

Beispiel:

Wenn wir Daten haben, die schon in Klassen eingeteilt sind, z. B. 11 Schüler haben zwischen 51 und 60 Punkte erhalten, berechnen wir das arithmetische Mittel folgendermaßen: Zuerst bilden wir die Klassenmitte. Dazu addieren wir Klassenanfang und Klassenende und teilen dies durch zwei. Also wie in dem Beispiel 61 + 70 dividiert durch 2 macht 65,5.

f_0093

Wenn wir dies für alle Klassen durchgeführt haben, bilden wir das arithmetische Mittel wie bei einer normalen Häufigkeitstabelle: Wir multiplizieren jeweils die Klassenmitte mit deren Häufigkeit. Danach addieren wir alle Werte der Faktoren. In unserem Beispiele ergibt die Summe 1728,5. Schließlich dividieren wir durch die Anzahl der der Häufigkeit insgesamt, hier 27. Das arithmetische Mittel dieser klassierten Daten beträgt also 64,0.

f_0094

Hier die allgemeine Formel dazu:

f_0095


2. Definition: Median

Der Median (Zentralwert einer Datenreihe) xMed ist derjenige Wert (Merkmalsausprägung), der in der Mitte steht, wenn alle Beobachtungswerte xi der Größe nach geordnet sind.

Hierbei ordnen wir alle Werte aus unserem Beispiel der Größe nach und bestimmen die Mitte. Um ihn zu finden addiert man 1 zu der Anzahl der Daten und teilt dies durch 2. In diesem Fall also (15 + 1) / 2 = 8. Also liegt der Median an 8. Stelle.

Median-Beispiel

Wie verändern sich Mittelwert und Median, wenn der größte Schüler die Klasse verlässt und für ihn eine kleine Schülerin mit der Körpergröße 150 dazu kommt?

Mittelwert-Median-verändern-sich

Wie verändert sich der Median, wenn ein weiterer Schüler mit der Körpergröße 180 dazu kommt?

Median-verändert-sich-nicht

Allgemeine Rechenvorschrift zur Berechnung des Median:

Median-Formel

Ergänzungen zum Median

Beispiel:

Ein Bautrupp mit 9 Personen hat folgende monatliche Einkünfte in Euro:

f_0096

Dieser Durchschnitt liefert ein falsches Bild, weil die Mehrzahl (7 von 9 Personen) höchstens 1200 € verdient. Der Wert 6600 € zieht den Mittelwert hierbei nach oben.
Deshalb sucht man nach einem Wert, der die Verteilung der Einkünfte besser charakterisiert.
Dazu werden die Verdienste der Größe nach sortiert. Dann sucht man den Wert in der Mitte. Hier die Formel dazu:

Median-Beispiel

Der Median beschreibt die Verteilung besser als der Mittelwert.
Man nennt ihn auch Zentralwert.

Median-Säulendiagramm
Ausreißer haben auf den Median also keinen Einfluss.

Berechnung des Medians anhand von Beispiel 1:

Wenn die Anzahl n der Merkmalsausprägungen ungerade ist, z.B. das Alter von 7 Mathematiklehrern ( n = 7 )

Median-ungrade-Anzahl

Dann stehen in der Tabelle links und rechts neben dem Median gleich viele Werte.

Beispiel 2:

Wenn die Anzahl der Merkmalsausprägungen gerade ist, z.B. das Alter von 8 Mathematiklehrern ( n = 8 ):

Median-grade-Anzahl

Dann berechnet man den Median aus den beiden mittleren Werten.

Bemerkungen zum Median:

Falls man eine gerade Anzahl eines ordinal skalierten Merkmales hat, existiert der Median nur, wenn beide Merkmalsausprägungen in der Mitte gleich sind. Z. B. bei den Zeugnisnoten 1 2 3 4 5 6 existiert kein Median, denn 3,5 als Zeugnisnote gibt es nicht.
Aber: 1 2 3 3 4 5 hat den Median 3.
Für den Fall, dass metrische Daten in Klassen gruppiert vorliegen, kann die exakte Merkmalsausprägung des Medians nicht bestimmt werden. Z. B. hier:

Median-bei-Klassen

3. Der Modalwert (Modus)

Bei Merkmalsausprägungen wie z.B. „rot, blau, grün“, also bei nominal skalierten Größen kann kein arithmetisches Mittel berechnet werden.
Hier kann man nur fragen, wie häufig die Merkmalsausprägung auftaucht.

Beispiel:

excel_029

Die Fremdsprache englisch kommt mit der größten Häufigkeit vor (84 mal)
Somit ist der Modalwert xMod = englisch.

Definition Modalwert:

Der Modalwert xMod ist der Merkmalswert, der am häufigsten vorkommt.

Bemerkung zum Modalwert:

Gibt es mehrere Merkmalsausprägungen mit der gleichen maximalen Häufigkeit, so existiert kein Modalwert. Z. B. wenn spanisch und englisch gleich häufig vorkommen.

Wenn man z. B. nicht jedes Gewicht eines Menschen einzeln auflistet, sondern in Klassen zusammenfasst:

f_0065
Bei einer solchen Klasseneinteilung ist der Modalwert die Mitte der am dichtesten besetzten Klasse. Also zwischen 51 und 60.


4. Vergleich: Mittelwert, Modalwert, Median

Hier eine Übersicht über diese drei Lagemaße:

f_0101

Die Noten in dem folgenden Beispiel sind metrisch skaliert, dh. es gibt auch Zwischennoten:

excel_031

Häufigkeitstabelle:

f_0103

Lagemaße im Säulendiagramm eingezeichnet:

Dann zeichnen wir alle Werte in dem Säulendiagramm ein.

des_020


5.  Das Stängel-Blatt-Diagramm

Zur Bestimmung des Medians müssen die Daten (Merkmalsausprägungen) geordnet werden. Das kann allerdings mühsam sein. Eine Erleichterung bietet hier das Stängel-Blatt-Diagramm.

Beispiel:

Zuerst sammeln wir die Daten in einer Urliste:

f_0104

Danach ordnen wir sie im Stängel-Blatt-Diagramm:

f_0105

Die Daten werden nach den Stängeln (Zehnerzahlen) geordnet.
Zu jedem Stängel werden dann die Blätter (Einerzahlen) der Größe nach hinzugeschrieben.
Die meisten Daten liegen im 2. Stängel.
Der Wert der größten Häufigkeit (Modalwert) ist xMod = 60
An der 14. Stelle steht der Median xMed = 63

In diesem Beitrag haben wir uns also mit den mittleren Werten einer Datenreihe beschäftigt. Es gibt aber oft einzelne Daten, die stark von allen anderen abweichen. Mit diesen Ausreißern beschäftigen wir uns im Beitrag Spannweite, Median, Varianz und Standardabweichung.


Dazu findest du hier Aufgaben hierzu I.

Alle Formeln zur beschreibenden Statistik sind hier zusammengestellt.
Hier findest du eine Übersicht über alle Beiträge zum Thema Statistik. Dort auch Links zu weiteren Aufgaben.