Przedziały ufności można wykorzystać do oszacowania kilku populacji parametry. Jeden typ parametru, który można oszacować za pomocą wnioskowanie statystyczne jest proporcją populacji. Na przykład możemy chcieć poznać procent populacji USA, która popiera określony akt prawny. W przypadku tego rodzaju pytań musimy znaleźć przedział ufności.
W tym artykule zobaczymy, jak skonstruować przedział ufności dla proporcji populacji i zbadamy część teorii, która się za tym kryje.
Ogólne ramy
Zaczynamy od spojrzenia na duży obraz, zanim przejdziemy do szczegółów. Rozważany przez nas przedział ufności ma następującą postać:
Oszacuj margines błędu +/-
Oznacza to, że musimy ustalić dwie liczby. Wartości te są oszacowaniem pożądanego parametru wraz z marginesem błędu.
Warunki
Przed przeprowadzeniem jakiegokolwiek testu lub procedury statystycznej ważne jest, aby upewnić się, że wszystkie warunki są spełnione. Aby uzyskać przedział ufności dla proporcji populacji, musimy upewnić się, że spełnione są następujące warunki:
- Mamy prosta losowa próbka wielkościowy n z dużej populacji
- Nasze osoby zostały wybrane niezależnie od siebie.
- W naszej próbie jest co najmniej 15 sukcesów i 15 porażek.
Jeśli ostatni element nie jest spełniony, może być możliwe nieznaczne dostosowanie naszej próbki i użycie plus cztery przedziały ufności. W dalszej części założymy, że wszystkie powyższe warunki zostały spełnione.
Proporcje próbek i populacji
Zaczynamy od oszacowania naszego odsetka ludności. Tak jak używamy średniej próby do oszacowania średniej populacji, tak samo używamy proporcji próby do oszacowania proporcji populacji. Proporcja populacji jest nieznanym parametrem. Proporcja próby jest statystyką. Ta statystyka jest obliczana poprzez zliczenie liczby sukcesów w naszej próbie, a następnie podzielenie przez całkowitą liczbę osób w próbie.
Proporcja populacji jest oznaczona przez p i jest oczywiste. Notacja dotycząca proporcji próbki jest nieco bardziej zaangażowana. Oznaczamy proporcję próbki jako p̂ i odczytujemy ten symbol jako „kapelusz p”, ponieważ wygląda jak litera p z czapką na górze.
To staje się pierwszą częścią naszego przedziału ufności. Oszacowanie p wynosi p̂.
Rozkład próbkowania proporcji próbki
Aby określić wzór marginesu błędu, musimy pomyśleć o dystrybucja próbek z p̂. Będziemy musieli poznać średnią, odchylenie standardowe i konkretny rozkład, z którym pracujemy.
Rozkład próbkowania p̂ jest rozkładem dwumianowym z prawdopodobieństwem sukcesu p i n próby. Ten typ zmiennej losowej ma średnią p i odchylenie standardowe (p(1 - p)/n)0.5. Są z tym dwa problemy.
Pierwszym problemem jest to, że rozkład dwumianowy może być bardzo trudny w pracy. Obecność silni może prowadzić do bardzo dużych liczb. Tutaj pomagają nam warunki. Dopóki nasze warunki są spełnione, możemy oszacować rozkład dwumianowy ze standardowym rozkładem normalnym.
Drugi problem polega na tym, że wykorzystuje standardowe odchylenie p̂ p w swojej definicji. Nieznany parametr populacji należy oszacować, stosując ten sam parametr jako margines błędu. To okrągłe rozumowanie jest problemem, który należy naprawić.
Wyjściem z tej zagadki jest zastąpienie standardowego odchylenia standardowym błędem. Standardowe błędy oparte są na statystykach, a nie parametrach. Standardowy błąd służy do oszacowania odchylenia standardowego. Strategia ta jest warta tego, że nie musimy już znać wartości parametru p.
Formuła
Aby użyć błędu standardowego, zastępujemy nieznany parametr p ze statystyką p̂. Wynikiem jest następujący wzór przedziału ufności dla proporcji populacji:
p +/- z * (p̂ (1 - p̂) /n)0.5.
Tutaj wartość z * zależy od naszego poziomu zaufania DO. Dokładnie do standardowego rozkładu normalnego do procent standardowego rozkładu normalnego jest pomiędzy -z * i z *. Wspólne wartości dla z * obejmują 1,645 dla 90% ufności i 1,96 dla 95% ufności.
Przykład
Zobaczmy, jak ta metoda działa na przykładzie. Załóżmy, że chcemy z 95% pewnością poznać procent elektoratu w hrabstwie, który określa się jako Demokratyczny. Przeprowadzamy prostą losową próbę 100 osób w tym hrabstwie i stwierdzamy, że 64 z nich identyfikuje się jako demokrata.
Widzimy, że wszystkie warunki są spełnione. Szacowany odsetek naszej populacji wynosi 64/100 = 0,64. Jest to wartość proporcji próbki p̂ i jest to środek naszego przedziału ufności.
Margines błędu składa się z dwóch części. Pierwszy to z*. Jak powiedzieliśmy, dla 95% pewności wartość z* = 1.96.
Druga część marginesu błędu jest podana wzorem (p̂ (1 - p̂) /n)0.5. Ustawiamy p = 0,64 i obliczamy = błąd standardowy, który ma być (0,64 (0,36) / 100)0.5 = 0.048.
Mnożymy te dwie liczby razem i otrzymujemy margines błędu 0,09408. Wynik końcowy to:
0.64 +/- 0.09408,
lub możemy przepisać to jako 54,592% do 73,408%. Dlatego jesteśmy w 95% pewni, że prawdziwy odsetek demokratów w populacji mieści się w przedziale tych wartości procentowych. Oznacza to, że na dłuższą metę nasza technika i formuła uchwycą odsetek populacji w 95% przypadków.
Powiązane pomysły
Istnieje wiele pomysłów i tematów związanych z tego rodzaju przedziałem ufności. Na przykład moglibyśmy przeprowadzić test hipotezy dotyczący wartości odsetka ludności. Możemy również porównać dwie proporcje z dwóch różnych populacji.