Datenerhebung und Darstellung

Einführung in die beschreibende Statistik

Definitionen

Anhand eines Beispiels einer Datenerhebung werde ich hier die wichtigsten Begriffe aus der Statistik erklären. Und damit in die Grundlagen der beschreibende Statistik in der Mathematik einführen.

In der beschreibenden Statistik werden Daten erhoben, aufbereitet und analysiert.

Beispiel:

Was ist an der Behauptung dran „Unsere Jugend wird immer dicker und träger“?
Um eine Behauptung dieser Art zu überprüfen kann man nicht alle Jugendlichen befragen, sondern nur einen Teil der Gesamtheit.

Stichprobe:

Wird der Teil einer Gesamtheit befragt, dann spricht man bei der Datenerhebung von einer Stichprobe.

Urliste:

Das Ergebnis der Stichprobe wird in einer Urliste festgehalten.
Beispiel einer Urliste:

Schüler

Nr.

Ge-schlecht Körper-

größe in cm

Gewicht

in kg

Rau-

cher

Sport-

art

w m
01 x 160 52 x Hand-

ball

 02 x 172  67 x Fuß-

ball

 03 x 180 60 x Golf
 …  …  …  …  …  …  …  …
 xx  x  170  65  x  Judo

(Eine entsprechende Urliste ist in der jeweiligen Klasse anonym zu erstellen)



Rohdaten:

Sind alle in der Urliste enthaltenen Daten.

Erhebungsumfang:

Ist die Anzahl der untersuchten Objekte (hier Schüler)
Werden z.B. 27 Schüler befragt, so sagt man, „Die Anzahl der Merkmalsträger ( n = 27 ) bildet den Erhebungsumfang“.

Merkmale:

Sind die Eigenschaften der Objekte. (z.B. Geschlecht, Körpergröße, Gewicht, Raucher, Sportart, …)

Merkmalsausprägung xi:

Ein Merkmal kann in verschiedenen Ausprägungen vorkommen. (z.B. Geschlecht m oder w)

Beispiele für Merkmale und deren Ausprägungen:

Merkmal Merkmalsausprägung xi
Geschlecht männlich, weiblich
Körpergröße 160 cm, 182 cm, 154 cm, 163 cm, …
Körpergewicht 52 kg, 81 kg, 71 kg , …..
Raucher ja, nein
Sportart Judo, Tischtennis, Fußball, …

Bemerkung:

Durch eine Erhebung soll festgestellt werden, wie die verschiedenen Ausprägungen eines Merkmals in einer Stichprobe verteilt sind.
Vor der Erhebung sind einige Fragen zu klären, z.B.
Wonach soll gefragt werden?
Welche Antworten sind möglich?
Welchen Umfang soll die Stichprobe haben?




Aufbereiten der Daten und ihre Darstellung

Ermittelung der Häufigkeit bestimmter Merkmalsausprägungen.

In einer Strichliste werden Merkmalsträger mit gleichen Merkmalsausprägungen für ein bestimmtes Merkmal zusammengefasst.

Bearbeitung des Merkmals Sportart

Bei sehr vielen Sportarten sind diese in Klassen zusammenfassen.

Strichliste:
f_0059
Der Merkmalsausprägung z.B. Fußball wird hier die absolute Häufigkeit 9 zugeordnet.

excel_001


Grafische Darstellung durch ein Säulendiagramm.

f_0060
Wertung:
f_0061

Auszug aus der Urliste einer Erhebung mit Berechnung des BMI:

 

Schüler
Nr.
Ge-

schlecht

Körper-

größe
in cm

Gewicht
in kg
BMI Wertung
w m
01 x 160 52 20,3 normal
02 x 172 67 22,6 normal
03 x 180 60 18,5 Untergewicht
04 x 167 55 19,7 Untergewicht
05 x 178 63 19,9 Untergewicht
06 x 175 63 20,6 normal
07 x 183 70 20,9 normal
08 x 188 78 22,1 normal
09 x 181 84 25,6 Übergewicht
10 x 183 68 20,3 normal
11 x 162 63 24,0 normal
12 x 171 57 19,5 Untergewicht
13 x 177 67 21,4 normal
14 x 165 58 21,3 normal
15 x 174 70 23,1 normal
16 x 179 73 22,8 normal
17 x 175 55 18,0 Untergewicht
18 x 183 72 21,5 normal
19 x 163 51 19,2 Untergewicht
20 x 163 60 22,6 normal
21 x 165 64 23,5 normal
22 x 171 51 17,4 Untergewicht
23 x 175 54 17,6 Untergewicht
24 x 176 68 22,0 normal
25 x 184 75 22,2 normal
26 x 185 76 22,2 normal
27 x 169 59 20,7 normal

BMI – Auswertung:
f_0062
excel_002

Bearbeitung des Merkmals Gewicht.

Auszug aus der Urliste: (Wertetabelle)
f_0063



Darstellung im Punktdiagramm (Streudiagramm).
excel_003

Durch die Zuordnung Schüler – Gewicht wird die Übersichtlichkeit nicht wesentlich erhöht.
Es kann jedoch unmittelbar abgelesen werden, dass das Gewicht aller Schüler zwischen 40 kg und 100 kg liegt.
Eine Strichliste zur Bestimmung der Häufigkeit einer bestimmten Merkmalsausprägung macht hier so keinen Sinn.

Eine Einteilung der Merkmalsausprägungen in Klassen wird nun durchgeführt.
Es werden 4 Klassen mit einer Klassenbreite von 10 kg gewählt, in welche die Körpergewichte eingeordnet werden.
Für das Merkmal Gewicht gibt es als Ausprägungen nun die Klassen I bis IV.

f_0064

Klasseneinteilung:

Werden verschiedene Merkmalsausprägungen zu einer neuen Ausprägung zusammengefasst, so spricht man von einer Klasseneinteilung der Stichprobenwerte.
Die Darstellung erfolgt in einem Säulendiagramm ohne Lücken.

Häufigkeitstabelle:
f_0065

Grafische Darstellung der Häufigkeitsverteilung der Klassen.
excel_004

Die Klassenbreite (10 kg) wurde willkürlich festgelegt.
Nun soll die Klassenbreite halbiert werden.
Damit vergrößert sich die Anzahl der Klassen.

Häufigkeitstabelle:
f_0066
excel_005

Grafiken im Vergleich:

Je geringer die Anzahl der Klassen, desto besser ist die Übersichtlichkeit.
Der Informationsgehalt wird aber geringer (Hier kann manipuliert werden).
Es gibt keine allgemeingültige Festlegung der Klassenbreite, deshalb muss eine sinnvolle Klassenbreite für die Häufigkeitstabelle gewählt werden.
Üblich ist ein Wert zwischen 5 und 10.

Weitere Darstellungsarten im Säulendiagramm:

Um die Unterschiede der Körpergewichte von Schülern und Schülerinnen aufzuzeigen, wird die Häufigkeitstabelle mit der Klassenbreite 10 kg nach männlich und weiblich aufgelistet.

Häufigkeitstabelle:
f_0067

Säulendiagramm für zwei Verteilungen:
excel_006

Doppelsäulendiagramm:
excel_007

Die Körpergewichte der Schülerinnen verteilen sich nur auf die ersten beiden Klassen, während 6 von 13 Schülern ein Gewicht von mehr als 70 kg haben.
f_0068

Weiteres Beispiel zur Klasseneinteilung.

In einer Klasse mit 32 Schülern misst jeder Schüler seine Pulsfrequenz.
Die Erhebungsdaten werden in eine Urliste eingetragen.
Zur Bestimmung der Klassenbreite und damit der Anzahl der Klassen ist es sinnvoll, in der Urliste den kleinsten und den größten Wert zu markieren.

f_0069

Klassenbreite 4 ergibt 10 Klassen.
f_0070

excel_008

Klassenbreite 8 ergibt 5 Klassen.
f_0071

excel_009

Im nächsten Beitrag werden wir näher betrachten, wie man von einer Urliste zu einer Grafik kommt und einen Überblick über die verschiedenen Darstellungsformen in der Statisktik kennenlernen.

Aufgaben hierzu: Merkmale

und Daten und Diagramme I

und Daten und Diagramme II

und Daten und Diagramme III

und Daten und Diagramme IV

und Daten und Diagramme V

und Daten und Diagramme VI

Übersicht: Formelsammlung zur beschreibenden  Statistik



123mathe.de wird laufend erweitert. Weitere Inhalte auf der alten Webseite brinkmann-du.de.
Gefällt dir die Seite? Dann freuen wir uns über ein like auf facebook
Die Unterrichtsmaterialien gibt es in unserem Shop. Pakete mit vielen PDF-Datei ab 1 Euro und für Lehrer als WORD-Dateien.