W wnioskowanie statystyczne, jednym z głównych celów jest oszacowanie nieznanego populacjaparametr. Zaczynasz z próbka statystyczna, i na tej podstawie możesz określić zakres wartości parametru. Ten zakres wartości nazywa się a przedział ufności.
Przedziały ufności
Przedziały ufności są do siebie podobne na kilka sposobów. Po pierwsze, wiele dwustronnych przedziałów ufności ma tę samą formę:
Oszacowanie ± Margines błędu
Po drugie, kroki obliczania przedziałów ufności są bardzo podobne, niezależnie od typu przedziału ufności, który próbujesz znaleźć. Konkretny typ przedziału ufności, który zostanie zbadany poniżej, to dwustronny przedział ufności dla populacji, gdy znasz populację odchylenie standardowe. Załóżmy również, że pracujesz z populacją, która jest normalnie dystrybuowane.
Przedział ufności dla średniej o znanej sigmie
Poniżej znajduje się proces znajdowania pożądanego przedziału ufności. Chociaż wszystkie kroki są ważne, pierwszy jest szczególnie:
- Sprawdź warunki: Zacznij od upewnienia się, że warunki przedziału ufności zostały spełnione. Załóżmy, że znasz wartość odchylenia standardowego populacji, oznaczonego przez grecki list sigma σ. Przyjmij także rozkład normalny.
- Oblicz kosztorys: Oszacuj parametr populacji - w tym przypadku średniej populacji - za pomocą statystyki, która w tym problemie jest średnią z próby. Wymaga to utworzenia prosta losowa próbka z populacji. Czasami możesz założyć, że twoja próbka to prosta losowa próbka, nawet jeśli nie spełnia ścisłej definicji.
- Krytyczna wartość: Uzyskaj wartość krytyczną z* który odpowiada twojemu poziomowi pewności. Wartości te można znaleźć, konsultując się z tabela wyników Z lub za pomocą oprogramowania. Możesz użyć tabeli z-score, ponieważ znasz wartość odchylenia standardowego populacji i zakładasz, że populacja jest normalnie rozłożona. Typowe wartości krytyczne to 1,645 dla 90-procentowego poziomu ufności, 1,960 dla 95-procentowego poziomu ufności i 2,576 dla 99-procentowego poziomu ufności.
- Margines błędu: Oblicz margines błędu z* σ /√n, gdzie n jest wielkością utworzonej przez Ciebie prostej próby losowej.
- Wyciągnąć wniosek: Zakończ, łącząc oszacowanie i margines błędu. Można to wyrazić jako albo Oszacowanie ± Margines błędu lub jako Szacunek - margines błędu do Oszacowanie + Margines błędu. Pamiętaj, aby wyraźnie stwierdzić poziom zaufania który jest dołączony do przedziału ufności.
Przykład
Aby zobaczyć, jak zbudować przedział ufności, przejrzyj przykład. Załóżmy, że wiesz, że wyniki IQ wszystkich studentów pierwszego roku studiów są zwykle rozkładane z odchyleniem standardowym wynoszącym 15. Masz prostą losową próbkę 100 pierwszoklasistów, a średni wynik IQ dla tej próbki wynosi 120. Znajdź 90-procentowy przedział ufności dla średniego wyniku IQ dla całej populacji przybywających studentów pierwszego roku studiów.
Wykonaj czynności opisane powyżej:
- Sprawdź warunki: Warunki zostały spełnione, ponieważ powiedziano ci, że odchylenie standardowe populacji wynosi 15 i że masz do czynienia z rozkładem normalnym.
- Oblicz kosztorys: Powiedziano ci, że masz prostą losową próbkę o wielkości 100. Średnie IQ dla tej próbki wynosi 120, więc to jest twoje oszacowanie.
- Krytyczna wartość: Wartość krytyczna dla poziomu ufności 90 procent jest podana przez z* = 1.645.
- Margines błędu: Posługiwać się wzór marginesu błędu i uzyskaj błąd o wartości z* σ /√n = (1.645)(15) /√(100) = 2.467.
- Wyciągnąć wniosek: Podsumuj, składając wszystko w całość. 90-procentowy przedział ufności dla średniego wyniku IQ w populacji wynosi 120 ± 2,467. Alternatywnie można podać ten przedział ufności jako 117,5325–122,4675.
Względy praktyczne
Przedziały ufności powyższego typu nie są zbyt realistyczne. Bardzo rzadko znamy odchylenie standardowe populacji, ale nie znamy średniej populacji. Istnieją sposoby na usunięcie tego nierealistycznego założenia.
Chociaż przyjęto rozkład normalny, założenie to nie musi być spełnione. Ładne próbki, które nie wykazują siły skośność lub mieć wartości odstające, wraz z wystarczająco dużą próbką, pozwalają na wywołanie centralne twierdzenie graniczne. W związku z tym uzasadnione jest używanie tabeli wyników Z, nawet w przypadku populacji, które zwykle nie są rozmieszczone.