Przedziały ufności są kluczową częścią statystyk wnioskowania. Możemy użyć pewnego prawdopodobieństwa i informacji z rozkład prawdopodobieństwa oszacować parametr populacji za pomocą próbki. Oświadczenie przedział ufności odbywa się w taki sposób, że łatwo go źle zrozumieć. Przyjrzymy się poprawnej interpretacji przedziałów ufności i zbadamy cztery błędy popełniane w tym obszarze statystyki.
Co to jest przedział ufności?
Przedział ufności można wyrazić jako zakres wartości lub w następującej formie:
Oszacowanie ± Margines błędu
Przedział ufności jest zwykle określany z pewnym poziomem ufności.Wspólne poziomy zaufania wynoszą 90%, 95% i 99%.
Spójrzmy na przykład, w którym chcemy użyć średniej próby, aby wywnioskować średnią populacji. Załóżmy, że skutkuje to przedziałem ufności od 25 do 30. Jeśli mówimy, że jesteśmy w 95% pewni, że nieznana populacja oznaczać jest zawarty w tym przedziale, to naprawdę mówimy, że znaleźliśmy ten przedział przy użyciu metody, która z powodzeniem daje prawidłowe wyniki w 95% przypadków. Na dłuższą metę nasza metoda zakończy się niepowodzeniem w 5% przypadków. Innymi słowy, nie uda nam się uchwycić prawdziwej populacji oznaczającej tylko jedną na 20 razy.
Błąd nr 1
Przyjrzymy się teraz szeregowi różnych błędów, które można popełnić, mając do czynienia z przedziałami ufności. Jednym z niepoprawnych stwierdzeń dotyczących przedziału ufności przy 95% poziomie pewności jest to, że istnieje 95% szans, że przedział ufności zawiera prawdziwą średnią populacji.
Powód, dla którego jest to błąd, jest w rzeczywistości dość subtelny. Kluczową ideą dotyczącą przedziału ufności jest to, że zastosowane prawdopodobieństwo wchodzi w obraz stosowana metoda, przy określaniu przedziału ufności, polega na tym, że odnosi się do metody, która jest używany.
Błąd nr 2
Drugim błędem jest interpretacja 95% przedziału ufności jako stwierdzenia, że 95% wszystkich wartości danych w populacji mieści się w tym przedziale. Ponownie 95% mówi o metodzie testu.
Aby zobaczyć, dlaczego powyższe stwierdzenie jest nieprawidłowe, możemy rozważyć normalną populację z odchylenie standardowe 1 i średnio 5. Próbka, która miała dwa punkty danych, każdy o wartości 6, ma średnią próbną 6. 95% przedział ufności dla średniej populacji wyniósłby 4,6 do 7,4. To oczywiście nie pokrywa się z 95% normalna dystrybucja, więc nie będzie zawierać 95% populacji.
Błąd nr 3
Trzecim błędem jest stwierdzenie, że 95% przedział ufności oznacza, że 95% wszystkich możliwych próbek mieści się w przedziale przedziału. Ponownie rozważ przykład z ostatniej sekcji. Każda próbka wielkości drugiej, która zawierała tylko wartości mniejsze niż 4,6, miałaby średnią mniejszą niż 4,6. Zatem te średnie próbki wypadłyby poza tym konkretnym przedziałem ufności. Próbki pasujące do tego opisu stanowią ponad 5% całkowitej kwoty. Błędem jest więc twierdzenie, że ten przedział ufności obejmuje 95% wszystkich średnich próbek.
Błąd nr 4
Czwarty błąd w radzeniu sobie z przedziałami ufności polega na tym, że są one jedynym źródłem błędów. Chociaż istnieje margines błędu związany z przedziałem ufności, istnieją inne miejsca, w których błędy mogą wkraść się do analizy statystycznej. Kilka przykładów tego rodzaju błędów może wynikać z niewłaściwego projektu eksperymentu, błędu w próbkowaniu lub niemożności uzyskania danych z określonej podgrupy populacji.