Co to jest rozkład próbkowania?

Próbkowanie statystyczne jest używany dość często w statystykach. W tym procesie staramy się ustalić coś na temat populacji. Ponieważ populacje są zazwyczaj dużych rozmiarów, tworzymy próbkę statystyczną, wybierając podzbiór populacji, który ma z góry określoną wielkość. Badając próbkę, możemy użyć statystyk wnioskowania, aby ustalić coś na temat populacji.

Próbka statystyczna wielkości n dotyczy jednej grupy n osoby lub podmioty, które zostały losowo wybrane z populacji. Z pojęciem próby statystycznej ściśle związany jest rozkład próbkowania.

Pochodzenie rozkładów próbkowania

Rozkład próbkowania występuje, gdy tworzymy więcej niż jeden prosta losowa próbka tej samej wielkości z danej populacji. Próbki te uważa się za niezależne od siebie. Więc jeśli dana osoba jest w jednej próbce, ma takie samo prawdopodobieństwo znalezienia się w kolejnej pobranej próbce.

Obliczamy określoną statystykę dla każdej próbki. To może być próbka oznaczać, wariancja próbki lub proporcja próbki. Ponieważ statystyki zależą od próbki, którą mamy, każda próbka zazwyczaj generuje inną wartość dla statystyki będącej przedmiotem zainteresowania. Zakres wytworzonych wartości jest tym, co daje nam rozkład próbkowania.

instagram viewer

Rozkład próbkowania dla średnich

Na przykład rozważymy rozkład próbkowania dla średniej. Średnia populacji to parametr, który zazwyczaj nie jest znany. Jeśli wybierzemy próbkę o wielkości 100, wówczas średnią z tej próbki można łatwo obliczyć, dodając wszystkie wartości razem, a następnie dzieląc przez całkowitą liczbę punktów danych, w tym przypadku 100. Jedna próbka o wielkości 100 może dać nam średnią 50. Inna taka próbka może mieć średnią 49. Kolejne 51 i kolejna próbka mogą mieć średnią 50,5.

Rozkład tych średnich próbek daje rozkład próbkowania. Chcielibyśmy rozważyć więcej niż tylko cztery przykładowe środki, tak jak to zrobiliśmy powyżej. Przy kilku innych środkach próbkowania mielibyśmy dobry pomysł na kształt rozkładu próbkowania.

Dlaczego nas to obchodzi?

Rozkład próbkowania może wydawać się dość abstrakcyjny i teoretyczny. Istnieją jednak bardzo ważne konsekwencje ich stosowania. Jedną z głównych zalet jest to, że eliminujemy zmienność występującą w statystykach.

Załóżmy na przykład, że zaczynamy od populacji ze średnią μ i odchyleniem standardowym σ. Odchylenie standardowe daje nam pomiar stopnia rozłożenia rozkładu. Porównamy to do rozkładu próbkowania uzyskanego przez utworzenie prostych losowych próbek wielkości n. Rozkład próbkowania średniej będzie nadal miał średnią μ, ale odchylenie standardowe jest inne. Odchylenie standardowe dla rozkładu próbkowania wynosi σ / √ n.

Zatem mamy następujące

  • Wielkość próbki 4 pozwala nam uzyskać rozkład próbkowania ze standardowym odchyleniem σ / 2.
  • Wielkość próby 9 pozwala nam uzyskać rozkład próbkowania ze standardowym odchyleniem σ / 3.
  • Wielkość próbki 25 pozwala nam uzyskać rozkład próbkowania ze standardowym odchyleniem σ / 5.
  • Wielkość próbki 100 pozwala nam uzyskać rozkład próbkowania ze standardowym odchyleniem σ / 10.

W praktyce

W praktyce statystycznej rzadko tworzymy rozkłady próbkowania. Zamiast tego traktujemy statystyki pochodzące z prostej losowej próbki wielkości n tak jakby były jednym punktem wzdłuż odpowiedniego rozkładu próbkowania. Podkreśla to ponownie, dlaczego chcemy mieć stosunkowo duże rozmiary próbek. Im większy rozmiar próby, tym mniej zmienności uzyskamy w naszej statystyce.

Zauważ, że poza środkiem i rozkładem, nie jesteśmy w stanie nic powiedzieć o kształcie naszego rozkładu próbkowania. Okazuje się, że w dość dość szerokich warunkach Twierdzenie o granicy centralnej można zastosować, aby powiedzieć nam coś niesamowitego o kształcie rozkładu próbkowania.