W przeprowadzeniu testu istotności lub test hipotez, są dwie liczby, które łatwo się pomylić. Liczby te można łatwo pomylić, ponieważ oba są liczbami od zera do jednego i oba są prawdopodobieństwami. Jedna liczba nazywana jest wartością p statystyki testowej. Inną liczbą zainteresowania jest poziom istotności lub alfa. Zbadamy te dwa prawdopodobieństwa i ustalimy różnicę między nimi.
Wartości alfa
Liczba alfa to mierzona wartość progowa wartości p przeciwko. Mówi nam, jak ekstremalne muszą być obserwowane wyniki, aby odrzucić hipotezę zerową testu istotności.
Wartość alfa jest powiązana z poziomem ufności naszego testu. Poniżej wymieniono niektóre poziomy ufności wraz z powiązanymi wartościami alfa:
- W przypadku wyników z 90-procentowym poziomem ufności wartość alfa wynosi 1 - 0,90 = 0,10.
- Dla wyników z 95 procentami poziom pewności siebie, wartość alfa wynosi 1 - 0,95 = 0,05.
- W przypadku wyników z 99-procentowym poziomem ufności wartość alfa wynosi 1 - 0,99 = 0,01.
- I ogólnie, dla wyników o poziomie ufności C procent wartość alfa wynosi 1 - C / 100.
Chociaż w teorii i praktyce można używać wielu liczb dla alfa, najczęściej stosowanym jest 0,05. Powodem tego jest zarówno to, że konsensus pokazuje, że poziom ten jest odpowiedni w wielu przypadkach i historycznie został zaakceptowany jako standard. Istnieje jednak wiele sytuacji, w których należy użyć mniejszej wartości alfa. Nie ma jednej wartości alfa to zawsze determinuje znaczenie statystyczne.
Wartość alfa daje nam prawdopodobieństwo a błąd typu I.. Błędy typu I występują, gdy odrzucamy prawdziwą hipotezę zerową. Tak więc na dłuższą metę dla testu z poziom istotności 0,05 = 1/20, prawdziwa hipoteza zerowa będzie odrzucana co 20 razy.
Wartości p
Inną liczbą, która jest częścią testu istotności, jest wartość p. Wartość p jest również prawdopodobieństwem, ale pochodzi z innego źródła niż alfa. Każda statystyka testowa ma odpowiednie prawdopodobieństwo lub wartość p. Ta wartość jest prawdopodobieństwem, że obserwowana statystyka wystąpiła przypadkowo, przy założeniu, że hipoteza zerowa jest prawdziwa.
Ponieważ istnieje wiele różnych statystyk testowych, istnieje wiele różnych sposobów na znalezienie wartości p. W niektórych przypadkach musimy znać rozkład prawdopodobieństwa populacji.
Wartość p statystyki testowej jest sposobem na stwierdzenie, jak ekstremalna jest ta statystyka dla naszych przykładowych danych. Im mniejsza wartość p, tym bardziej nieprawdopodobna obserwowana próbka.
Różnica między wartością p a wartością alfa
Aby ustalić, czy obserwowany wynik jest statystycznie istotny, porównujemy wartości alfa i wartość p. Pojawiają się dwie możliwości:
- Wartość p jest mniejsza lub równa alfa. W tym przypadku odrzucamy hipotezę zerową. Kiedy tak się dzieje, mówimy, że wynik jest statystycznie istotny. Innymi słowy, jesteśmy dość pewni, że istnieje coś oprócz samego przypadku, co dało nam zaobserwowaną próbkę.
- Wartość p jest większa niż alfa. W tym przypadku nie odrzucamy Hipoteza zerowa. Kiedy tak się dzieje, mówimy, że wynik nie jest statystycznie istotny. Innymi słowy, jesteśmy dość pewni, że nasze zaobserwowane dane można wyjaśnić wyłącznie przez przypadek.
Z powyższego wynika, że im mniejsza jest wartość alfa, tym trudniej jest twierdzić, że wynik jest statystycznie istotny. Z drugiej strony, im większa wartość alfa, tym łatwiej jest twierdzić, że wynik jest statystycznie istotny. W połączeniu z tym jest jednak większe prawdopodobieństwo, że to, co zaobserwowaliśmy, można przypisać przypadkowi.