Wiele razy ankiety polityczne i inne zastosowania statystyki podać swoje wyniki z marginesem błędu. Często zdarza się, że w sondażu stwierdza się poparcie dla danego problemu lub kandydata u pewnego odsetka respondentów, plus pewien minus jeden procent. To ten plus i minus to margines błędu. Ale jak obliczany jest margines błędu? Dla prosta losowa próbka w przypadku wystarczająco dużej populacji margines lub błąd jest tak naprawdę tylko powtórzeniem wielkości próby i stosowanego poziomu ufności.
Wzór na margines błędu
W dalszej części wykorzystamy wzór na margines błędu. Zaplanujemy najgorszy możliwy przypadek, w którym nie mamy pojęcia, jaki jest prawdziwy poziom wsparcia w naszych ankietach. Gdybyśmy mieli jakieś pojęcie o tym numerze, być może na podstawie poprzednich danych z odpytywania, mielibyśmy mniejszy margines błędu.
Stosujemy formułę: mi = zα/2/ (2√ n)
Poziom zaufania
Pierwszą informacją potrzebną do obliczenia marginesu błędu jest ustalenie, jakiego poziomu ufności oczekujemy. Ta liczba może wynosić dowolny procent mniej niż 100%, ale najbardziej powszechne poziomy ufności to 90%, 95% i 99%. Z tych trzech najczęściej stosowany jest poziom 95%.
Jeśli odejmiemy poziom ufności od jednego, uzyskamy wartość alfa, zapisaną jako α, potrzebną do wzoru.
Wartość krytyczna
Kolejnym krokiem w obliczaniu marginesu lub błędu jest znalezienie odpowiedniej wartości krytycznej. Wskazuje na to termin zα/2 w powyższym wzorze. Ponieważ przyjęliśmy prostą losową próbę dużej populacji, możemy użyć standardowy rozkład normalny z z- wyniki.
Załóżmy, że pracujemy z 95% pewnością. Chcemy sprawdzić z-wynik z *dla których pole od -z * do z * wynosi 0,95. Z tabeli wynika, że ta wartość krytyczna wynosi 1,96.
Mogliśmy również znaleźć wartość krytyczną w następujący sposób. Jeśli myślimy w kategoriach α / 2, ponieważ α = 1 - 0,95 = 0,05, widzimy, że α / 2 = 0,025. Przeszukujemy teraz tabelę, aby znaleźć z-strzał o powierzchni 0,025 po prawej stronie. Ostatecznie otrzymamy tę samą wartość krytyczną 1,96.
Inne poziomy zaufania dadzą nam różne wartości krytyczne. Im wyższy poziom pewności, tym wyższa będzie wartość krytyczna. Wartość krytyczna dla 90% poziomu ufności, przy odpowiadającej wartości α 0,10, wynosi 1,64. Wartość krytyczna dla 99% poziomu ufności, przy odpowiadającej wartości α 0,01, wynosi 2,54.
Wielkość próbki
Jedyną inną liczbą, której potrzebujemy, używając wzoru do obliczenia margines błędu jest wielkość próbki, oznaczony przez n we wzorze. Następnie bierzemy pierwiastek kwadratowy z tej liczby.
Ze względu na położenie tej liczby w powyższym wzorze, im większy wielkość próbki którego używamy, tym mniejszy będzie margines błędu. Dlatego duże próbki są lepsze niż mniejsze. Ponieważ jednak próbkowanie statystyczne wymaga zasobów czasu i pieniędzy, istnieją ograniczenia dotyczące tego, o ile możemy zwiększyć wielkość próby. Obecność pierwiastka kwadratowego we wzorze oznacza, że czterokrotne zwiększenie wielkości próby spowoduje tylko połowę marginesu błędu.
Kilka przykładów
Aby zrozumieć formułę, spójrzmy na kilka przykładów.
- Jaki jest margines błędu dla prostej losowej próby 900 osób przy 95%poziom pewności siebie?
- Korzystając z tabeli mamy wartość krytyczną 1,96, więc margines błędu wynosi 1,96 / (2 √ 900 = 0,03267, czyli około 3,3%.
- Jaki jest margines błędu dla prostej losowej próby 1600 osób o 95% poziomie ufności?
- Na tym samym poziomie pewność siebie jako pierwszy przykład zwiększenie wielkości próbki do 1600 daje nam margines błędu 0,0245 lub około 2,5%.