Wiele razy badacze chcą poznać odpowiedzi na pytania o szerokim zakresie. Na przykład:
- Co wszyscy w danym kraju oglądali zeszłej nocy w telewizji?
- Kto robi elektorat zamierzam głosować na w nadchodzących wyborach?
- Ile ptaków powraca z migracji w określonym miejscu?
- Jaki procent siły roboczej jest bezrobotny?
Tego rodzaju pytania są ogromne w tym sensie, że wymagają od nas śledzenia milionów osób.
Statystyki upraszczają te problemy, stosując technikę zwaną próbkowaniem. Przeprowadzając próbę statystyczną, można znacznie zmniejszyć obciążenie pracą. Zamiast śledzić zachowania miliardów lub milionów, musimy tylko zbadać zachowania tysięcy lub setek. Jak zobaczymy, to uproszczenie ma swoją cenę.
Populacje i spisy powszechne
Populacja badań statystycznych jest tym, o czym próbujemy się dowiedzieć. Składa się ze wszystkich badanych osób. Populacja może być naprawdę wszystkim. Kalifornijczycy, caribous, komputery, samochody lub powiaty mogą być uważane za populacje, w zależności od pytania statystycznego. Chociaż większość badanych populacji jest duża, niekoniecznie muszą być.
Jedną ze strategii badania populacji jest przeprowadzenie spisu ludności. Podczas spisu badamy każdego członka populacji w naszym badaniu. Doskonałym tego przykładem jest Spis powszechny USA. Co dziesięć lat Biuro Spisów Powszechnych wysyła kwestionariusz do wszystkich w kraju. Osoby, które nie zwrócą formularza, odwiedzają pracownicy spisu
Spisy są pełne trudności. Zazwyczaj są one drogie pod względem czasu i zasobów. Ponadto trudno jest zagwarantować dotarcie do wszystkich osób w populacji. Inne populacje są jeszcze trudniejsze do przeprowadzenia spisu ludności. Jeśli chcielibyśmy poznać nawyki bezpańskich psów w stanie Nowy Jork, powodzenia wszystko tych przejściowych psów.
Próbki
Ponieważ śledzenie każdego członka populacji jest zwykle niemożliwe lub niepraktyczne, następną dostępną opcją jest pobranie próbki populacji. Próbka to dowolny podzbiór populacji, więc jej rozmiar może być mały lub duży. Chcemy, aby próbka wystarczająco mała, aby mogła nią zarządzać nasza moc obliczeniowa, ale wystarczająco duża, aby dać nam statystycznie znaczące wyniki.
Jeśli firma wyborcza próbuje określić zadowolenie wyborców z Kongresu i jego kongresu wielkość próbki jest jeden, to wyniki będą bez znaczenia (ale łatwe do uzyskania). Z drugiej strony, proszenie milionów ludzi zużyje zbyt wiele zasobów. Aby zachować równowagę, ankiety tego typu zazwyczaj mają próbki o wielkości około 1000.
Losowe próbki
Ale odpowiedni rozmiar próbki nie wystarczy, aby zapewnić dobre wyniki. Chcemy próbki reprezentatywnej dla populacji. Załóżmy, że chcemy dowiedzieć się, ile książek przeciętny Amerykanin czyta rocznie. Prosimy 2000 studentów, aby śledzili to, co czytali w ciągu roku, a następnie sprawdzili z nimi po upływie roku. Stwierdzamy, że średnia liczba przeczytanych książek wynosi 12, a następnie dochodzimy do wniosku, że przeciętny Amerykanin czyta 12 książek rocznie.
Problem z tym scenariuszem dotyczy próby. Większość studentów ma od 18 do 25 lat i ich instruktorzy muszą czytać podręczniki i powieści. To słaba reprezentacja przeciętnego Amerykanina. Dobra próbka zawierałaby osoby w różnym wieku, ze wszystkich środowisk i z różnych regionów kraju. Aby uzyskać taką próbkę, musielibyśmy ją skomponować losowo, aby każdy Amerykanin miał równe prawdopodobieństwo bycia w próbce.
Rodzaje próbek
Złotym standardem eksperymentów statystycznych jest prosta losowa próbka. W takiej próbce wielkości n osób, każdy członek populacji ma takie samo prawdopodobieństwo wyboru do próby i każdej grupy n osoby mają takie samo prawdopodobieństwo bycia wybranym. Istnieje wiele sposobów próbkowania populacji. Niektóre z najczęstszych to:
- Losowa próbka
- Prosta losowa próbka
- Próbka dobrowolnej odpowiedzi
- Próbka wygodna
- Próbka systematyczna
- Próbka klastra
- Próbka rozwarstwiona
Kilka słów porad
Jak mówi przysłowie: „Dobrze rozpoczęte jest w połowie gotowe”. Aby zapewnić, że nasze badania statystyczne i eksperymenty mają dobre wyniki, musimy je starannie zaplanować i rozpocząć. Łatwo jest znaleźć złe próbki statystyczne. Dobry proste losowe próbki wymagają trochę pracy, aby uzyskać. Jeśli nasze dane zostały uzyskane przypadkowo i w sposób kawalerski, to bez względu na to, jak skomplikowane są nasze analizy, techniki statystyczne nie dadzą nam żadnych wartościowych wniosków.