Wariancja populacji wskazuje, jak rozłożyć zbiór danych. Niestety zazwyczaj nie jest możliwe dokładne określenie tego parametru populacji. Aby zrekompensować nasz brak wiedzy, wykorzystujemy temat z wnioskowania statystycznego o nazwie przedziały ufności. Zobaczymy przykład, jak obliczyć przedział ufności dla wariancji populacji.
Formuła przedziału ufności
Wzór na (1 - α) przedział ufności dotyczący wariancji populacji. Jest podany przez następujący ciąg nierówności:
[ (n - 1)s2] / b < σ2 < [ (n - 1)s2] / ZA.
Tutaj n to wielkość próbki, s2 to wariancja próbki. Numer ZA jest punktem rozkładu chi-kwadrat z n -1 stopni swobody, przy których dokładnie α / 2 obszaru pod krzywą znajduje się na lewo od ZA. W podobny sposób liczba b jest punktem tego samego rozkładu chi-kwadrat o dokładnie α / 2 powierzchni pod krzywą po prawej stronie b.
Czynności wstępne
Zaczynamy od zestawu danych z 10 wartościami. Ten zestaw wartości danych został uzyskany przez prostą próbę losową:
97, 75, 124, 106, 120, 131, 94, 97,96, 102
Konieczna byłaby analiza danych eksploracyjnych w celu wykazania, że nie występują wartości odstające. Konstruując działka łodygi i liścia widzimy, że te dane prawdopodobnie pochodzą z dystrybucji, która jest w przybliżeniu normalnie dystrybuowana. Oznacza to, że możemy przystąpić do znalezienia 95% przedziału ufności dla wariancji populacji.
Próbka wariancji
Musimy oszacować wariancję populacji z wariancją próby, oznaczoną przez s2. Zaczniemy więc od obliczenia tej statystyki. Zasadniczo uśredniamy suma kwadratowych odchyleń od średniej. Jednak zamiast dzielenia tej sumy przez n dzielimy to przez n - 1.
Stwierdzamy, że średnia próbki wynosi 104,2. Korzystając z tego, mamy sumę kwadratowych odchyleń od średniej podanej przez:
(97 – 104.2)2 + (75 – 104.3)2 +... + (96 – 104.2)2 + (102 – 104.2)2 = 2495.6
Dzielimy tę sumę przez 10 - 1 = 9, aby otrzymać wariancję próbki 277.
Rozkład chi-kwadrat
Przechodzimy teraz do naszego rozkładu chi-kwadrat. Ponieważ mamy 10 wartości danych, mamy 9 stopnie swobody. Ponieważ chcemy środkowego 95% naszej dystrybucji, potrzebujemy 2,5% w każdym z dwóch ogonów. Sprawdzamy tabelę chi-kwadrat lub oprogramowanie i widzimy, że wartości tabel 2.7004 i 19.023 obejmują 95% powierzchni dystrybucji. Te liczby są ZA i bodpowiednio.
Mamy teraz wszystko, czego potrzebujemy i jesteśmy gotowi zebrać przedział ufności. Formuła dla lewego punktu końcowego to [(n - 1)s2] / b. Oznacza to, że nasz lewy punkt końcowy to:
(9 x 277) / 19,023 = 133
Właściwy punkt końcowy można znaleźć, zastępując b z ZA:
(9 x 277) /2,7004 = 923
Jesteśmy więc w 95% pewni, że wariancja populacji wynosi od 133 do 923.
Odchylenie standardowe populacji
Oczywiście, ponieważ odchylenie standardowe jest pierwiastkiem kwadratowym wariancji, tę metodę można zastosować do skonstruowania przedziału ufności dla odchylenia standardowego dla populacji. Wszystko, co musielibyśmy zrobić, to wziąć pierwiastek kwadratowy punktów końcowych. Wynik byłby 95% przedziałem ufności dla odchylenie standardowe.