Przykład testu dwóch prób T i przedziału ufności

Czasami w statystykach pomocne są sprawdzone przykłady problemów. Te przykłady mogą pomóc nam znaleźć podobne problemy. W tym artykule przeprowadzimy proces przeprowadzania wnioskowania statystycznego dla wyniku dotyczącego dwóch średnich populacji. Nie tylko zobaczymy, jak przeprowadzić test hipotez o różnicy dwóch średnich populacji, zbudujemy również przedział ufności dla tej różnicy. Stosowane przez nas metody są czasami nazywane testem t dwóch próbek i przedziałem ufności t dwóch próbek.

Stwierdzenie problemu

Załóżmy, że chcemy przetestować zdolności matematyczne dzieci w wieku szkolnym. Jednym z pytań, które możemy mieć, jest to, czy wyższe poziomy mają wyższe średnie wyniki testów.

Prosta losowa próba 27 równiarki poddawana jest testowi matematycznemu, ich odpowiedzi są punktowane, a wyniki mają średnią ocenę 75 punktów z Odchylenie standardowe próbki z 3 punktów.

Prosta losowa próba 20 uczniów piątej klasy przechodzi ten sam test matematyczny, a ich odpowiedzi są punktowane. Średnia ocena dla piątej równiarki wynosi 84 punkty, przy odchyleniu standardowym próbki wynoszącym 5 punktów.

instagram viewer

Biorąc pod uwagę ten scenariusz, zadajemy następujące pytania:

  • Czy dane z próby dostarczają nam dowodów, że średni wynik testu populacji wszystkich uczniów piątej klasy przekracza średni wynik testu populacji wszystkich uczniów klas trzecich?
  • Jaki jest 95% przedział ufności dla różnicy średnich wyników testu między populacjami klas równiarki trzeciej i piątej?

Warunki i procedura

Musimy wybrać, której procedury użyć. Czyniąc to, musimy upewnić się i sprawdzić, czy warunki tej procedury zostały spełnione. Jesteśmy proszeni o porównanie dwóch średnich populacji. Jedną z metod, które można w tym celu wykorzystać, są dwie procedury T dla dwóch próbek.

Aby zastosować te procedury t dla dwóch próbek, musimy upewnić się, że spełnione są następujące warunki:

  • Mamy dwie proste losowe próbki z dwóch interesujących populacji.
  • Nasze proste losowe próbki nie stanowią więcej niż 5% populacji.
  • Dwie próbki są od siebie niezależne i nie ma dopasowania między badanymi.
  • Zmienna jest zwykle rozkładana.
  • Zarówno średnia populacji, jak i odchylenie standardowe są nieznane dla obu populacji.

Widzimy, że większość tych warunków jest spełniona. Powiedziano nam, że mamy proste losowe próbki. Populacje, które badamy, są duże, ponieważ w tych klasach są miliony studentów.

Warunkiem, którego nie jesteśmy w stanie automatycznie założyć, jest normalne rozłożenie wyników testu. Ponieważ mamy wystarczająco dużą wielkość próby, ze względu na wytrzymałość naszych procedur t niekoniecznie potrzebujemy rozkładu zmiennej.

Ponieważ warunki są spełnione, wykonujemy kilka wstępnych obliczeń.

Standardowy błąd

Błąd standardowy jest oszacowaniem odchylenia standardowego. Dla tej statystyki dodajemy wariancję próbek, a następnie pierwiastek kwadratowy. To daje wzór:

(s1 2 / n1 + s22 / n2)1/2

Korzystając z powyższych wartości, widzimy, że wartość błędu standardowego wynosi

(32 / 27+ 52 / 20)1/2 =(1 / 3 + 5 / 4 )1/2 = 1.2583

Stopnie swobody

Możemy zastosować konserwatywne przybliżenie dla naszego stopnie swobody. Może to nie doceniać liczby stopni swobody, ale jest o wiele łatwiejsze do obliczenia niż przy użyciu wzoru Welcha. Używamy mniejszego z dwóch rozmiarów próbek, a następnie odejmujemy jeden od tej liczby.

W naszym przykładzie mniejsza z dwóch próbek wynosi 20. Oznacza to, że liczba stopni swobody wynosi 20-1 = 19.

Test hipotez

Chcemy przetestować hipotezę, że uczniowie klasy piątej mają średni wynik testu, który jest większy niż średni wynik uczniów klas trzecich. Niech μ1 być średnią oceną populacji wszystkich piątoklasistów. Podobnie, pozwalamy μ2 być średnim wynikiem dla populacji wszystkich równiarki.

Hipotezy są następujące:

  • H.0: μ1 - μ2 = 0
  • H.za: μ1 - μ2 > 0

Statystyka testowa jest różnicą między średnimi próbki, która jest następnie dzielona przez błąd standardowy. Ponieważ używamy przykładowych odchyleń standardowych do oszacowania odchylenia standardowego populacji, statystyka testowa z rozkładu t.

Wartość statystyki testowej wynosi (84–75) /1,2583. To około 7,15.

Teraz określamy, jaka jest wartość p dla tego testu hipotez. Patrzymy na wartość statystyki testowej i gdzie znajduje się ona na rozkładzie t z 19 stopniami swobody. Do tej dystrybucji mamy 4,2 x 10-7 jako naszą wartość p. (Jednym ze sposobów ustalenia tego jest użycie funkcji T.DIST.RT w Excelu.)

Ponieważ mamy tak małą wartość p, odrzucamy hipotezę zerową. Wniosek jest taki, że średni wynik testu dla uczniów piątej klasy jest wyższy niż średni wynik testu dla uczniów klas trzecich.

Przedział ufności

Ponieważ ustaliliśmy, że istnieje różnica między średnimi wynikami, określamy teraz przedział ufności dla różnicy między tymi dwoma średnimi. Mamy już wiele tego, czego potrzebujemy. Przedział ufności dla różnicy musi mieć zarówno oszacowanie, jak i margines błędu.

Oszacowanie dla różnicy dwóch średnich jest łatwe do obliczenia. Po prostu znajdujemy różnicę średnich próbek. Ta różnica średnich z próby szacuje różnicę średnich z populacji.

Dla naszych danych różnica w średnich próbek wynosi 84 - 75 = 9.

Margines błędu jest nieco trudniejszy do obliczenia. W tym celu musimy pomnożyć odpowiednią statystykę przez błąd standardowy. Potrzebne statystyki można znaleźć, sprawdzając tabelę lub oprogramowanie statystyczne.

Ponownie, stosując konserwatywne przybliżenie, mamy 19 stopni swobody. Dla 95% przedziału ufności widzimy, że t* = 2.09. Przydałoby się Funkcja T.INV w Excel, aby obliczyć tę wartość.

Teraz zebraliśmy wszystko i widzimy, że nasz margines błędu wynosi 2,09 x 1,2583, czyli około 2,63. Przedział ufności wynosi 9 ± 2,63. Przedział wynosi od 6,37 do 11,63 punktu w teście wybranym przez uczniów piątej i trzeciej klasy.

instagram story viewer