Hypothesen testen (Signifikanztests)
Springe zu den Inhalten
- Linksseitiger Signifikanztest
- Signifikanztests/ Rechtsseitiger Signifikanztest
- Zweiseitiger Signifikanztest
Unsere Schüler können die zugehörigen Videos auf https://www.abacus-lernportal.de anschauen.
Zurück zur Übersicht
Linksseitiger Signifikanztest
Unterschied zwischen links-, rechts- und zweiseitigen Tests Die Bezeichnung bezieht sich auf die Lage des Ablehnungsbereiches A - A liegt links, wenn A von Null bis zur kritischen Grenze g reicht: A={0;...;g} - A liegt rechts, wenn A von der kritischen Grenze g bis zum Stichprobenumfang n reicht: A={g;...;n} - A ist zweigeteilt, wenn niedrige oder hohe Stichprobenergebnisse zur Ablehnung der Nullhypothese führen: A={0;...;g1}∪{g2;...;n} Nun lernst du, selbst Hypothesen zu testen. Als Beispiel geht es um eine Partei, die aus Umfrageergebnissen auf ihren Wähleranteil in der Bevölkerung schließen will. Ich habe das Szenario jeweils leicht abgewandelt, damit es einmal ein linksseitiger, ein rechtsseitiger bzw. ein zweiseitiger Test wird. (Links- und rechtsseitige Tests sind einseitige Tests.)
Lösungsbeschreibung
In diesem Video zeige ich dir, wie du einen linkseitigen Signifikanztest durchführst. Dazu nehmen wir diese Aufgabe. Die Umfrageergebnisse einer Partei lagen bisher bei 40%.
Wegen negativer Schlagzeilen fürchtet die Partei, Wähler verloren zu haben. Bei einer neuen Umfrage geben 300 von 1000 Befragten an, dass sie die Partei wählen würden. Kann aufgrund dieses Ergebnisses davon ausgegangen werden, dass der Wähleranteil gesunken ist? Das Signifikanzniveau des Tests soll 5% betragen.
Früher war der Wähleranteil 40%. Das entspricht einer Wahrscheinlichkeit von 0,4. Der alte Zustand ist immer die Nullhypothese, die mit H0 bezeichnet wird.
Bei einem linkseitigen Test steht hier entweder istgleich oder größergleich. Größergleich schreibst du, wenn in der Aufgabe zum Beispiel das Signalwort mindestens steht. Zum Beispiel die Umfrageergebnisse lagen bisher bei mindestens 40%.
Der Test wird aber genauso gemacht wie bei p istgleich 0,4. Die Nullhypothese steht nun auf dem Prüfstand. Die Vermutung ist nämlich, dass p jetzt kleiner als 0,4 ist.
Das ist die Alternativhypothese oder kurz Alternative. Sie wird mit H1 bezeichnet. Die Zufallsvariable x gibt die Anzahl der Befragten an, die die Partei wählen würden.
Bei wahrer Nullhypothese ist x wie folgt verteilt. x ist binomial verteilt, denn entweder würde man die Partei wählen oder nicht. n ist 1000, da 1000 Leute befragt werden.
Und p ist entsprechend der Nullhypothese 0,4. Würde hier größergleich stehen, würdest du hier trotzdem ein istgleich schreiben. Das wäre der Extremfall bei wahrer Nullhypothese.
Und es genügt, den Extremfall zu betrachten. Hier siehst du die Verteilung von x. Der Erwartungswert ist 400. Denn wenn p 0,4 ist, ist zu erwarten, dass 400 von 1000 Leuten die Partei wählen würden.
Würden aber viel weniger Leute die Partei wählen, spricht das gegen die Nullhypothese und für die Alternative. Jetzt geht es darum, die genaue Grenze festzulegen. Wie viele Personen dürften es dafür höchstens sein? Nennen wir diese Anzahl mal g. Wir verwerfen die Nullhypothese also, wenn x kleinergleich g ist.
Nun kann es aber passieren, dass x kleinergleich g ist, obwohl die Nullhypothese wahr ist. Wir würden dann die Nullhypothese zu Unrecht verwerfen. Das wird als Fehler erster Art bezeichnet.
Die Wahrscheinlichkeit, dass das passiert, soll maximal 5% betragen. Das ist das sogenannte Signifikanzniveau. Das bedeutet, die Irrtumswahrscheinlichkeit, also die Wahrscheinlichkeit für den Fehler erster Art, beträgt maximal 5%.
Die Wahrscheinlichkeit hiervon soll also kleinergleich 5% sein, also 0,05. Mit dieser Bedingung kannst du die Grenze g bestimmen. Hier siehst du einen Teil der kumulierten Verteilung.
Hier steht jetzt also kleinergleich, wie hier. Jetzt suchen wir den Balken, der höchstens bis 0,05 geht. Das ist der letzte rote Balken.
g ist somit 374. Der kritische rote Bereich liegt links vom Erwartungswert. Deshalb wird das linksseitiger Test genannt.
Jetzt zeige ich dir, wie du die Grenze g formal berechnest. Hier siehst du nochmal die Bedingung, die aus dem Signifikanzniveau folgt. Nun bestimmst du g mit dem Taschenrechner.
Bei den meisten Rechnern heißt die Funktion dafür Binomcdf. Für n gibst du 1000 ein, für p 0,4 und die dritte Eingabe entspricht g. Gib dafür zum Beispiel 374 ein. Die Wahrscheinlichkeit, dass höchstens 374 der Befragten die Partei wählen würden, ist 0,0495.
Das ist kleiner als 0,05. Bei 375 ist die Wahrscheinlichkeit schon größer als 0,05. Somit muss g 374 sein.
Denn das ist die größte Zahl, bei der diese Wahrscheinlichkeit noch unter 5% liegt. Nun kannst du den Ablehnungsbereich der Nullhypothese angeben. Dieser reicht von 0 bis 374 Stimmen.
Der Annahmebereich, bei dem die Nullhypothese beibehalten wird, geht dann entsprechend von 375 bis 1000 Stimmen. Die Entscheidungsregel lautet, die Nullhypothese wird abgelehnt, wenn höchstens 374 Befragte die Partei wählen würden. Unsere Entscheidung lautet daher, da nur 300 Befragte die Partei wählen würden, wird die Nullhypothese abgelehnt.
Es ist davon auszugehen, dass der Wähleranteil gesunken ist. Wir nehmen also die Alternative an.
Zurück zur Übersichtnoch oben
Signifikanztests/ Rechtsseitiger Signifikanztest
Lösungsbeschreibung
In diesem Video zeige ich dir, wie du einen rechtzeitigen Signifikanztest durchführst. Dazu nehmen wir diese Aufgabe. Die Umfrageergebnisse einer Partei lagen bisher bei 40 Prozent.
Durch aufwendige Werbekampagnen hofft die Partei, Wähler gewonnen zu haben. Bei einer neuen Umfrage geben 450 von 1000 Personen an, dass sie die Partei wählen würden. Kann aufgrund dieses Ergebnisses davon ausgegangen werden, dass der Wähleranteil gestiegen ist? Das Signifikanzniveau des Tests soll 5 Prozent betragen.
Früher war der Wähleranteil 40 Prozent. Das entspricht einer Wahrscheinlichkeit von 0,4. Der alte Zustand ist immer die Nullhypothese, die mit H0 bezeichnet wird.
Bei einem rechtzeitigen Test steht hier entweder Istgleich oder Kleinergleich. Kleinergleich schreibst du, wenn in der Aufgabe zum Beispiel das Signalwort Höchstens steht. Zum Beispiel die Umfrageergebnisse lagen bisher bei höchstens 40 Prozent.
Der Test wird aber genauso gemacht wie bei P Istgleich 0,4. Die Nullhypothese steht nun auf dem Prüfstand. Die Vermutung ist nämlich, dass P jetzt größer ist als 0,4.
Das ist die Alternativhypothese oder kurz Alternative. Sie wird mit H1 bezeichnet. Die Zufallsvariable x gibt die Anzahl der Befragten an, die die Partei wählen würden.
Bei wahrer Nullhypothese ist x wie folgt verteilt. x ist binomial verteilt, denn entweder würde man die Partei wählen oder nicht. n ist tausend, da tausend Leute befragt werden und p ist entsprechend der Nullhypothese 0,4.
Würde hier Kleinergleich stehen, würdest du hier trotzdem mein Istgleich schreiben. Das wäre der Extremfall bei wahrer Nullhypothese und es genügt, den Extremfall zu betrachten. Hier siehst du die Verteilung von x. Der Erwartungswert ist 400, denn wenn p 0,4 ist, ist zu erwarten, dass 400 von tausend Leuten die Partei wählen würden.
Würden aber viel mehr Leute die Partei wählen, spricht das gegen die Nullhypothese und für die Alternative. Jetzt geht es darum, die genaue Grenze festzulegen. Wie viele Personen müssten es dafür mindestens sein? Nennen wir diese Anzahl mal g. Wir verwerfen die Nullhypothese also, wenn x größer gleich g ist.
Nun kann es aber passieren, dass x größer gleich g ist, obwohl die Nullhypothese wahr ist. Wir würden dann die Nullhypothese zu Unrecht verwerfen. Das wird als Fehler erster Art bezeichnet.
Die Wahrscheinlichkeit, dass das passiert, soll maximal 5% betragen. Das ist das sogenannte Signifikanzniveau. Das bedeutet, die Irrtumswahrscheinlichkeit, also die Wahrscheinlichkeit für den Fehler erster Art, beträgt maximal 5%.
Die Wahrscheinlichkeit hiervon soll somit kleiner gleich 5%, also 0,05 sein. Mit dieser Bedingung kannst du die Grenze g bestimmen. Wenn die roten Balken einer Wahrscheinlichkeit von höchstens 5% entsprechen, entsprechen diese mindestens 95%.
Hier siehst du einen Teil der kumulierten Verteilung. Jetzt suchen wir den ersten Balken, der mindestens bis 0,95 geht. Das ist der letzte gelbe Balken.
Am ersten roten Balken können wir dann g ablesen. g ist 427. Der kritische rote Bereich ist rechts vom Erwartungswert.
Deshalb wird das rechtseitiger Test genannt. Jetzt zeige ich dir, wie du die Grenze g formal berechnest. Hier siehst du nochmal die Bedingung, die aus dem Signifikanzniveau folgt.
Nun bestimmst du g mit dem Taschenrechner. Größer gleich ist aber immer unpraktisch zum Rechnen, deshalb musst du das umformen. Das geht mit dem Gegenereignis.
Diese Wahrscheinlichkeit ist dann 1 minus die Wahrscheinlichkeit vom Gegenereignis. Und das Gegenereignis zu mindestens g ist höchstens g-1, also x kleiner gleich g-1. Nun formst du so um, dass das alleine auf einer Seite steht.
Bringe das zum Beispiel auf diese Seite und das auf diese Seite. Hier rechnest du Plus und hier Minus. 1 minus 0,05 ist 0,95.
Hier habe ich noch die Seiten getauscht. Das Relationszeichen dreht sich dabei natürlich mit um. Nun bestimmst du g-1 durch Probieren mit dem Taschenrechner.
Bei den meisten Rechnern heißt die Funktion dafür Binomcdf. Für n gibst du 1000 ein, für p 0,4 und die dritte Eingabe entspricht g-1. Gib dafür zum Beispiel 425 ein.
Die Wahrscheinlichkeit, dass höchstens 425 der Befragten die Partei wählen würden, ist 0,9498. Das ist noch kleiner als 0,95. Bei 426 ist die Wahrscheinlichkeit größer als 0,95.
Somit muss g-1 426 sein. Denn das ist die kleinste Zahl, bei der diese Wahrscheinlichkeit nicht mehr unter 95% liegt. Rechne Plus 1 und du erhältst g gleich 427.
Nun kannst du den Ablehnungsbereich der Nullhypothese angeben. Dieser geht von 427 bis 1000 Stimmen. Der Annahmebereich, bei dem die Nullhypothese beibehalten wird, geht dann von 0 bis 426 Stimmen.
Die Entscheidungsregel lautet, die Nullhypothese wird abgelehnt, wenn mindestens 427 Befragte die Partei wählen würden. Unsere Entscheidung lautet daher, da 450 Befragte die Partei wählen würden, wird die Nullhypothese abgelehnt. Es ist davon auszugehen, dass der Wähleranteil gestiegen ist.
Wir nehmen also die Alternative an.
Zurück zur Übersichtnoch oben
Zweiseitiger Signifikanztest
Lösungsbeschreibung
In diesem Video zeige ich dir, wie du einen zweiseitigen Signifikanztest durchführst. Dazu nehmen wir diese Aufgabe. Die Umfrageergebnisse einer Partei lagen bisher bei 40 Prozent.
Nun werden erneut 1.000 Personen befragt, welche Partei sie wählen würden. Bei welchen Ergebnissen würde man davon ausgehen, dass sich der Wähleranteil der Partei geändert hat? Das Signifikanzniveau des Tests soll 5 Prozent betragen. Früher war der Wähleranteil 40 Prozent.
Das entspricht einer Wahrscheinlichkeit von 0,4. Der alte Zustand ist immer die Nullhypothese, die mit H0 bezeichnet wird. Bei dieser Aufgabe ist das Ergebnis der Umfrage nicht bekannt.
Es geht aber darum, herauszufinden, ob sich der Wähleranteil geändert hat. Dann wäre p ungleich 0,4. Das ist die Alternativhypothese oder kurz Alternative.
Sie wird mit H1 bezeichnet. Die Zufallsvariable x gibt die Anzahl der Befragten an, die die Partei wählen würden. Bei wahrer Nullhypothese ist x wie folgt verteilt.
x ist binomial verteilt, denn entweder würde man die Partei wählen oder nicht. n ist tausend, da tausend Leute befragt werden, und p ist entsprechend der Nullhypothese 0,4. Hier siehst du diese Verteilung.
Der Erwartungswert ist 400, denn wenn p 0,4 ist, ist zu erwarten, dass 400 von tausend Leuten die Partei wählen würden. Würden aber viel mehr oder viel weniger Leute die Partei wählen, spricht das gegen die Nullhypothese und für die Alternative. Jetzt geht es darum, die genauen Grenzen festzulegen.
Nennen wir die gesuchten Zahlen mal a und b. Wir verwerfen die Nullhypothese also, wenn x kleiner gleich a ist oder größer gleich b. Nun kann es aber passieren, dass eines davon eintrifft, obwohl die Nullhypothese wahr ist. Wir würden dann die Nullhypothese zu Unrecht verwerfen. Das wird als Fehler erster Art bezeichnet.
Die Wahrscheinlichkeit, dass das passiert, soll maximal 5% betragen. Das ist das sogenannte Signifikanzniveau. Das bedeutet, die Irrtumswahrscheinlichkeit, also die Wahrscheinlichkeit für den Fehler erster Art, beträgt höchstens 5%.
Da es zwei Möglichkeiten für den Fehler erster Art gibt, teilst du die 5% je zur Hälfte auf. Die Wahrscheinlichkeit hiervon soll somit kleiner gleich 2,5% sein. Das entspricht 0,025.
Und hier genauso. Mit diesen Bedingungen kannst du die Grenzen a und b bestimmen. Hier siehst du einen Teil der kumulierten Verteilung.
Hier steht jetzt also kleiner gleich, wie hier. Jetzt suchen wir den letzten Balken, der höchstens bis 0,025 geht. Das ist der letzte rote Balken.
a ist somit 369. Nun bestimmen wir noch b. Wenn diese roten Balken einer Wahrscheinlichkeit von höchstens 2,5% entsprechen, entsprechen die übrigen mindestens 97,5%. Jetzt suchen wir hier den ersten Balken, der mindestens bis 0,975 geht.
Das ist der letzte gelbe Balken. Am ersten roten Balken können wir dann b ablesen. b ist 431.
Der kritische rote Bereich ist einmal rechts und einmal links vom Erwartungswert. Deshalb wird das zweiseitiger Test genannt. Jetzt zeige ich dir, wie du die Grenzen a und b formal berechnest.
Hier siehst du nochmal die Bedingungen, die aus dem Signifikanzniveau folgen. Nun bestimmst du a und b mit dem Taschenrechner. Beginnen wir mit a. Bei den meisten Rechnern heißt die entsprechende Funktion dafür Binomcdf.
Für n gibst du 1000 ein, für p 0,4 und die dritte Eingabe entspricht a. Gib dafür zum Beispiel 369 ein. Die Wahrscheinlichkeit, dass höchstens 369 der Befragten die Partei wählen würden, ist 0,0241. Das ist kleiner als 0,025.
Bei 370 ist die Wahrscheinlichkeit schon größer als 0,025. Somit muss a 369 sein. Denn das ist die größte Zahl, bei der diese Wahrscheinlichkeit noch nicht über 2,5% liegt.
Nun bestimmen wir b. Größergleich ist immer unpraktisch zum Rechnen. Deshalb musst du das umformen. Das geht mit dem Gegenereignis.
Diese Wahrscheinlichkeit ist dann 1 minus die Wahrscheinlichkeit vom Gegenereignis. Und das Gegenereignis zu mindestens b ist höchstens b minus 1. Also x kleiner gleich b minus 1. Nun formst du so um, dass das allein auf einer Seite steht. Bringe das zum Beispiel auf diese Seite und das auf diese Seite.
Hier rechnest du Plus und hier rechnest du Minus. 1 minus 0,025 ist 0,975. Hier habe ich noch die Seiten getauscht.
Das Relationszeichen dreht sich dabei natürlich mit um. Nun bestimmst du b minus 1 wieder durch Probieren mit dem Taschenrechner. Für n gibst du 1000 ein, für p 0,4 und die dritte Eingabe entspricht b minus 1. Gib dafür zum Beispiel 429 ein.
Die Wahrscheinlichkeit, dass höchstens 429 der Befragten die Partei wählen würden, ist 0,9712. Das ist noch kleiner als 0,975. Bei 430 ist die Wahrscheinlichkeit größer als 0,975.
Somit muss b minus 1 430 sein. Denn das ist die kleinste Zahl, bei der diese Wahrscheinlichkeit nicht mehr unter 97,5% liegt. Rechne Plus 1 und du erhältst b gleich 431.
Nun kannst du den Ablehnungsbereich der Nullhypothese angeben. Dieser reicht von 0 bis 369 Stimmen sowie von 431 bis 1000 Stimmen. Das war A und das war B. Das ist das Zeichen für die Vereinigung beider Mengen.
Der Annahmebereich, bei dem die Nullhypothese beibehalten wird, geht dann von 370 bis 430 Stimmen. Die Entscheidungsregel lautet, stimmen in der Umfrage höchstens 369 oder mindestens 431 Befragte für die Partei, wird die Nullhypothese abgelehnt. Würdest du das Umfrageergebnis kennen, müsstest du nach dieser Regel entscheiden, ob die Nullhypothese abzulehnen ist oder nicht.
Falls ja, wird die Alternative angenommen. Das beantwortet die Frage in der Aufgabe. Bei weniger als 370 oder mehr als 430 Stimmen würde man davon ausgehen, dass sich der Wähleranteil geändert hat.
Zurück zur Übersichtnoch oben