Kategorien
Mathematik Wahrscheinlichkeitsrechnung

Hypothesentest einfach erklärt, Würfeln

Hypothesentest einfach erklärt mit Würfeln


In diesem Beitrag werde ich den Hypothesentest anhand von Beispielen mit Würfeln einfach erklären. Zwischendurch erläutere ich einiges zur Nullhypothese. Außerdem mache ich Bemerkungen zur Vorgehensweise bei Würfelexperimenten. Anhand mehrerer Beispiele zeige ich die Berechnung, die Auswertung und zeige die graphische Darstellung. Dann erkläre die Fehler 1. und 2. Art. Außerdem stelle ich die Änderung des Signifikanzniveaus vor. Zum Schluss stelle ich Rechenhelfer für die Binomialverteilung zur Verfügung.

Der Laplace-Würfel

Bei einem Laplace-Würfel beträgt die Wahrscheinlichkeit bei jedem Wurf eine 6 zu würfeln 1/6. Bei vielen Würfelspielen hat die 6 eine besondere Bedeutung. Aus Sicht des Spielers mag ein guter Würfel der sein, der möglichst oft eine 6 liefert. Hingegen aus der Sicht eines Spielbetreibers sollte der Würfel möglichst selten eine 6 zeigen. Hier liegen also unterschiedliche Interessen vor. Deshalb testen wir im folgenden Würfel.


Beispiel I

Wir vermuten, dass ein Würfel häufiger die 6 liefert, als es bei einem Laplace-Würfel zu erwarten ist. Also p > 1/6 . Um den Würfel zu testen, werfen wir den Würfel n = 600 mal. Dabei betrachten wir die Zufallsvariable X = Anzahl der aufgetretenen Sechsen. Durch einen Hypothesentest untersuchen wir, ob p > 1/6 gilt. Welche Hypothese müssen wir hierfür wählen?
Damit man p > 1/6 als richtig ansehen kann, muss man davon überzeugt sein, dass p ≤ 1/6 nicht stimmen kann. Wir testen also die Hypothese H0: p ≤ 1/6 auch Nullhypothese genannt. Falls diese abgelehnt werden muss, wird H1: p > 1/6 auch Alternativhypothese genannt angenommen.

Erläuterungen zur Nullhypothese

Die Nullhypothese H0 sollte immer die Hypothese sein, mit der der Test durchgeführt wird.
Für sie sollte gelten: H0: p ≤ p0 ; H0: p = p0 ;  oder H0: p ≥ p0.Zur Nullhypothese gibt es stets eine Alternativhypothese.

Hypothesentest-Würfel-recht-linksseitiger-Test

Eine Entscheidung für H0 führt stets zur Ablehnung von H1.
Eine Entscheidung gegen H0 führt dagegen stets zur Annahme von H1.

Der Fehler, den wir bei der Entscheidung machen können, soll auf höchstens 5% beschränkt werden. Diese Größe heißt Signifikanzniveau. Um den Würfel zu testen, müssen wir also für
Hypothesentest-Würfel-H0-1/6
ein Annahmebereich und ein Ablehnungsbereich berechnen.

Bemerkungen zur Vorgehensweise bei  Würfelexperimenten

Bei dem Würfelexperiment handelt es sich um einen Bernoulliversuch mit einer Binomialverteilung der Zufallsvariablen X. Eine solche Verteilung ist nur dann symmetrisch zum Erwartungswert µ, wenn p = 0,5 ist. Für p = 1/6 ist die Verteilungsfunktion nicht mehr symmetrisch. Bei hinreichend hoher Streuung ist die Laplace- Bedingung ( Sigma > 3 ) erfüllt. Dann kann man die Binomialverteilung durch eine zum Erwartungswert symmetrische Normalverteilung approximieren, so dass wir zur Berechnung von Umgebungswahrscheinlichkeiten die Tabelle (weiter unten) der Wahrscheinlichkeiten für Sigma- Umgebungen normalverteilter Zufallsvariablen verwenden können. Für den Umgebungsradius einer x%-Umgebung um den Erwartungswert gilt:

Hypothesentest-Würfel-90-95-99-Umgebung

Berechnung:
Hypothesentest-Würfel-Berechnung

Wir müssen also einen rechtsseitiger Hypothesentest durchführen, denn eine hohe Anzahl 6er spricht gegen H0.
Bei einem Signifikanzniveau von 5% müssen wir folgende Intervalle betrachten:

Hypothesentest-Würfel-5-%

die obere Grenze des Annahmebereichs für H0.
Es gilt: Annahmebereich für H0: { 0 … 115 }
Ablehnungsbereich für H0: { 116 … 600 }

Wir prüfen also den Ablehnungsbereich derart, dass gilt:

Hypothesentest-Würfel-0,0445

Berechnung mit dem GTR Casio fx-CG20:

Eine Einführung in den Casio fx-CG20 und Casio fx-CG50 findest du hier.
Dort findest du auch eine Anleitung, wie man den Casio fx-CG20 auf den Casio fx-CG50 updaten kann.

Eingabebeispiel mit ähnlichen Zahlen für P(X ≥ k) ≤ α ⇒ k = ? und P(X ≥ k)

Hypothesentest-Würfel-0,0467
Bemerkung:

Die geringfügigen Unterschiede der Werte findest man in der Berechnungsmethode.
Den Wert 0,0445 haben wir mit gerundeten Tabellenwerten der Normalverteilung ermittelt.
Der Wert 0,0467… ist der realistische Wert, den die Binomialverteilung liefert, denn um eine solche handelt es sich in der Aufgabenstellung.
Da man die Binomialverteilung durch eine Normalverteilung approximieren kann, wenn die Laplace-Bedingung (weiter unten) erfüllt ist, liefert die Normalverteilung Werte mit geringer Abweichung.

Auswertung:

Falls bei 600 Würfen die Anzahl der verzeichneten 6er in den Ablehnungsbereich von H0 ( { 116 … 600 } ) fällt, müssen wir H0 ablehnen und H1 annehmen. Das würde bedeuten, dass der Würfel tatsächlich mehr 6er lieferte als er sollte. Möglicherweise ist er dann gezinkt.
Falls man die H0-Hypothese aufgrund des Versuchsergebnisses ablehnt, geschieht das mit einem Fehler von etwa 4,45% (berechnetes Signifikanzniveau). Das ist der Fehler 1. Art und bedeutet:
Die Wahrscheinlichkeit dafür, dass man die H0-Hypothese aufgrund des Versuchsergebnisses ablehnt, obwohl sie richtig ist, beträgt etwa 4,45%. Diese Wahrscheinlichkeit wird auch Irrtumswahrscheinlichkeit genannt.
Anders ausgedrückt: Mit einer Wahrscheinlichkeit von 4,45% nimmt man an, dass der Würfel gezinkt ist, obwohl er in Ordnung ist.

Graphische Darstellung:
Hypothesentest-Würfel-Graph




Beispiel II

Man vermutet, dass ein Würfel weniger häufig die Sechs liefert, als man bei einem Laplace-Würfel erwartet. p < 1/6 .

Die Vorgehensweise ist analog wie bei Fall I.
Man untersucht, ob p < 1/6 gilt.
Man testet also die Hypothese H0: p ≥ 1/6.
Falls man diese ablehnen muss, nimmt man H1: p < 1/6 an.

Berechnung:
Hypothesentest-Würfel-9,129-größer-3

Man führt einen linksseitiger Hypothesentest durch, denn eine geringe Anzahl 6er spricht gegen H0.
Bei einem Signifikanzniveau von 5% betrachtet man folgende Intervalle:

Hypothesentest-Würfel-85,03
die untere Grenze des Annahmebereichs für H0.
Es gilt:
Annahmebereich für H0: { 85 … 600 }
Ablehnungsbereich für H0: { 0 … 84 }

Dann prüft man den Ablehnungsbereich derart, dass gilt:

Hypothesentest-Würfel-0,0445

Berechnung mit dem GTR Casio fx-CG20

Eingabebeispiel mit ähnlichen Zahlen für P(X ≤ k) ≤ α ⇒ k = ? (weiter unten) und P(X ≤ k)

Hypothesentest-Würfel-0,0424
Bemerkung:

Die geringfügigen Unterschiede der Werte sind in der Berechnungsmethode zu finden.
Den Wert 0,0445 haben wir mit gerundeten Tabellenwerten der Normalverteilung ermittelt.
Der Wert 0,0424… ist der realistische Wert, den die Binomialverteilung liefert, denn um eine solche handelt es sich in der Aufgabenstellung.
Da man die Binomialverteilung durch eine Normalverteilung approximieren kann, wenn die Laplace-Bedingung erfüllt ist, liefert die Normalverteilung Werte mit geringer Abweichung.

Auswertung:

Falls bei 600 Würfen die Anzahl der verzeichneten 6er in den Ablehnungsbereich von H0 ( { 0 … 84 } ) fällt, muss man H0 ablehnen und H1 annehmen. Das würde bedeuten, dass der Würfel tatsächlich weniger 6er lieferte als er sollte. Möglicherweise ist er gezinkt.
Falls man die H0-Hypothese aufgrund des Versuchsergebnisses ablehnt, geschieht das mit einem Fehler von etwa 4,45% (berechnetes Signifikanzniveau). Das ist der Fehler 1. Art und bedeutet:
Die Wahrscheinlichkeit dafür, dass man die H0-Hypothese aufgrund des Versuchsergebnisses ablehent obwohl sie richtig ist, beträgt etwa 4,45%.
Anders ausgedrückt:
Mit einer Wahrscheinlichkeit von 4,45% nimmt man an, dass der Würfel gezinkt ist, obwohl er in Ordnung ist.

Graphische Darstellung:
Hypothesentest-Würfel-Graph




Beispiel III

Von einem Würfel vermuten wir, dass er die Sechs mit einer Wahrscheinlichkeit liefert, die nicht gleich 1/6 ist, wie es bei einem Laplace-Würfel zu erwarten wäre. Wir entwerfen also einen Test, um die Hypothese, es handele sich um keinen Laplace-Würfel, zu untersuchen.
Die Vorgehensweise ist ähnlich wie bei Fall I und Fall II.
Es soll untersucht werden ob p ≠ 1/6 gilt.
Nullhypothese H0: p = 1/6; Alternativhypothese H1: p ≠ 1/6.
Anders als in Fall I und Fall II muss hier der Ablehnungsbereich von H0 auf beiden Seiten vom Erwartungswert liegen, denn viele 6er, wie auch wenig 6er sprechen gegen H0. Das Signifikanzniveau wird auf beide Ablehnungsbereiche zu gleichen Teilen aufgeteilt. Man spricht bei einem solchen Test von einem zweiseitigen Test.

Berechnung:

f_1690

Wir müssen einen zweiseitiger Hypothesentest durchführen, denn eine geringe Anzahl, wie auch eine hohe Anzahl 6er spricht gegen H0.

Bei einem Signifikanzniveau von 5% sind folgende Intervalle zu betrachten:

f_1691
die untere Grenze des Annahmebereichs für H0.
f_1692
die obere Grenze des Annahmebereichs für H0.

Es gilt:
Annahmebereich für H0: { 82 … 118 }
Ablehnungsbereich für H0: { 0 … 81 } u { 119 … 600 }

Zu prüfen ist der Ablehnungsbereich derart, das gilt:

f_1693

Berechnung mit dem GTR Casio fx-CG20

Eingabebeispiel mit ähnlichen Zahlen für P(X ≤ k) ≤ α ⇒ k = ? (jeweils weiter unten) und P(X ≥ k) ≤ α ⇒ k = ? und P(X ≤ k) und P(X ≥ k)

f_1693_1
Bemerkung:

Die geringfügigen Unterschiede der Werte sind in der Berechnungsmethode zu finden.
Der Wert 0,042 wurde mit gerundeten Tabellenwerten der Normalverteilung ermittelt.
Der Wert 0,0424… ist der realistische Wert, den die Binomialverteilung liefert, denn um eine solche handelt es sich in der Aufgabenstellung.
Da die Binomialverteilung durch eine Normalverteilung approximiert werden kann, wenn die Laplace-Bedingung erfüllt ist, liefert die Normalverteilung Werte mit geringer Abweichung.

Auswertung:

Falls bei 600 Würfen die Anzahl der verzeichneten 6er in den Ablehnungsbereich von H0 ( { 0 … 81 } ∪ { 119 … 600 } ) fällt, ist H0 abzulehnen und H1 anzunehmen.
Das würde bedeuten, das der Würfel tatsächlich nicht die Anzahl 6er liefert, wie er sollte. Möglicherweise ist er gezinkt.
Falls die H0-Hypothese aufgrund des Versuchsergebnisses abgelehnt wird, geschieht das mit einem Fehler von etwa 4,2% (berechnetes Signifikanzniveau).
Das ist der Fehler 1. Art und bedeutet:
Die Wahrscheinlichkeit dafür, dass die H0-Hypothese aufgrund des Versuchsergebnisses abgelehnt wird obwohl sie richtig ist, beträgt etwa 4,2%.
Anders ausgedrückt:
Mit einer Wahrscheinlichkeit von 4,2% nimmt man an, dass der Würfel gezinkt ist, obwohl er in Ordnung ist.

Graphische Darstellung:
des_193




Fehlerbetrachtungen

Fall I bis Fall III haben gezeigt, dass das jeweils gebildete Urteil falsch sein kann.

Fehler 1. Art:

Es handelt sich in Wirklichkeit um einen Laplace-Würfel, doch da das Testergebnis zufällig in den Ablehnungsbereich von H0 fällt, wird H0 fälschlicherweise abgelehnt.
Kurz: Die wahre Hypothese wird abgelehnt.

Fehler 2. Art:

Es handelt sich in Wirklichkeit nicht um einen Laplace-Würfel, doch da das Testergebnis in den Annahmebereich von H0 fällt, wird H0 fälschlicherweise angenommen.
Kurz: Die falsche Hypothese wird angenommen.
Der Fehler 2. Art lässt sich nur berechnen, wenn man bei einem gefälschten Würfel eine bestimmte Wahrscheinlichkeit für eine Sechs annimmt oder man sie weiß.


Fallbeispiel

Ein Glücksspiel auf dem Jahrmarkt heißt „Jede Sechs gewinnt“.
Ein ehemaliger Mitarbeiter des Betreibers geht zur Polizei und behauptet, die Würfel seien derart gefälscht, dass 6er nur mit einer Wahrscheinlichkeit von p = 0,13 auftreten würden. Der vom Betrugsdezernat beauftragte Kommissar Brinkmann macht sich zuvor Gedanken, wie er an den Fall herangehen will.
Aus seiner Schulzeit weiß er, dass Würfeln ein Zufallsversuch ist. Er weiß auch, dass bei einem Laplace-Würfel es durchaus vorkommen kann, dass auch nach mehr als 6 Würfen keine 6 erscheint. Um statistisch die Wahrscheinlichkeit für 6er mit einer hinreichenden Genauigkeit zu ermitteln, müsste er viele tausend Würfelversuche durchführen lassen. Da er aber nicht bis zu seiner Pensionierung mit diesem Fall beschäftigt sein möchte, beschließt er lediglich 600 Versuche zu dokumentieren und aus dem Ergebnis eine Schlussfolgerung zu ziehen.
Nach Sichtung der Stochastik-Unterlagen aus seiner Schulzeit, beschließt er zur Entscheidungsfindung einen Hypothesentest zu entwickeln.

f_1694
H0 soll auf einem Signifikanzniveau von 5% getestet werden.
Das ist der gleiche Test, wie er unter Fall II bereits beschrieben wurde. Annahmebereich von H0 { 85 … 600 }; Ablehnungsbereich von H0 { 0 … 84 } mit einer Irrtumswahrscheinlichkeit von 4,45%.
Um den Fehler 2. Art berechnen zu können nimmt Kommissar Brinkmann aufgrund der Informantenaussage an, dass die tatsächliche Wahrscheinlichkeit für 6er p = 0,13 beträgt.
Er berechnet die Wahrscheinlichkeit mit der ein Ergebnis unter der Voraussetzung dass p = 0,13 stimmt, in den Annahmebereich von H0 fällt.

Berechnung:

f_1695

Berechnung mit dem GTR Casio fx-CG20

Eingabebeispiel mit ähnlichen Zahlen für P(X ≥ k)
P(A) = P(X ≥ 85) = 1 – BinomialCD(84, 600, 0.13) = 0,2133…

Auswertung:

Falls bei 600 Würfen die Anzahl der verzeichneten 6er in den Ablehnungsbereich von H0 fällt, wird der Kommissar den vermeintlich gefälschten Würfel beschlagnahmen und den Spielebetreiber verhaften. Den Fehler, den er bei dieser Entscheidung begeht, beträgt etwa 4,45%. Denn die Wahrscheinlichkeit, mit der ein Laplace- Würfel dieses Ergebnis zeigt, beträgt 4,45%. Dieses Risiko geht der Kommissar ein.
Da andererseits, falls der Würfel wirklich gefälscht ist, mit einer Wahrscheinlichkeit von 21,5% die Anzahl der verzeichneten 6er in den Annahmebereich von H0 fällt, wird der Kommissar mit einer Wahrscheinlichkeit von 21,5% den gefälschten Würfel als solchen nicht erkennen.

Graphische Darstellung:
des_194

Änderung des Signifikanzniveaus:

Kommissar Pingelig erhält einen ähnlichen Auftrag und lässt sich, da er von Stochastik nur wenig Ahnung hat, die Unterlagen von Brinkmann schicken.
Er will nun ähnlich verfahren, wie sein Kollege. Jedoch ein Signifikanzniveau von 4,45% erscheint ihm zu hoch. Er möchte mit einer Wahrscheinlichkeit von etwa 97,5% Sicherheit seine Entscheidung treffen.

Berechnung:
f_1696

Man muss einen linksseitiger Hypothesentest durchführen, denn eine geringe Anzahl 6er spricht gegen H0.

Bei einem Signifikanzniveau von 2,5% sind folgende Intervalle zu betrachten:

f_1697
die untere Grenze des Annahmebereichs für H0.

Es gilt:
Annahmebereich für H0: { 82 … 600 }
Ablehnungsbereich für H0: { 0 … 81 }

Zu prüfen ist der Ablehnungsbereich derart, das gilt:

f_1698

Berechnung mit dem GTR Casio fx-CG20

Eingabebeispiel mit ähnlichen Zahlen für P(X ≤ k) ≤ α ⇒ k = ? (weiter unten) und P(X ≤ k)

f_1698_1

Fehler 2. Art:

f_1699

Berechnung mit dem GTR Casio fx-CG20
Eingabebeispiel mit ähnlichen Zahlen für P(X ≥ k)
P(A) = P(X ≥ 82) = 1 – BinomialCD(81, 600, 0.13) = 0,3310…

Auswertung:

Falls bei 600 Würfen die Anzahl der verzeichneten 6er in den Ablehnungsbereich von H0 fällt, wird Kommissar Pingelig den vermeintlich gefälschten Würfel beschlagnahmen und den Spielebetreiber verhaften. Den Fehler, den er bei dieser Entscheidung begeht, beträgt etwa 2,1%. Denn die Wahrscheinlichkeit, mit der ein Laplache- Würfel dieses Ergebnis zeigt, beträgt 2,1%. Dieses Risiko geht Pingelig ein.
Da andererseits, falls der Würfel wirklich gefälscht ist, mit einer Wahrscheinlichkeit von 33,7% die Anzahl der verzeichneten 6er in den Annahmebereich von H0 fällt, wird der Kommissar mit einer Wahrscheinlichkeit von 33,7% den gefälschten Würfel als solchen nicht erkennen.

Graphische Darstellung:

des_195

Fazit:

Die Gefahr, sich in der Öffentlichkeit durch vorschnelle, letztlich ungerechtfertigte Festnahmen zu diskreditieren ist bei Kommissar Pingelig geringer als bei Kommissar Brinkmann. (Dafür konnte Herr Brinkmann bessere Mathematik-Webseiten erstellen! 😉
Der Preis für die Sicherheit ist jedoch ein größerer Fehler 2. Art, was bedeutet gefälschte Würfel werden seltener als solche erkannt.


Rechenhelfer für die Binomialverteilung

                   

formel_02              int_02

formel_03              int_03

formel_04       int_04

Aufgaben zum Hypothesentest I

und Hypothesentest II



Hier findest du eine Übersicht über alle Beiträge zum Thema Wahrscheinlichkeitsrechnung.