Przewodnik dla początkujących po statystykach

Ile kalorii zjadł każdy z nas na śniadanie? Jak daleko od domu wszyscy dzisiaj podróżowali? Jak duże jest miejsce, które nazywamy domem? Ile osób nazywa to domem? Aby zrozumieć wszystkie te informacje, konieczne są pewne narzędzia i sposoby myślenia. Matematyka zwana statystyką pomaga nam uporać się z tym przeciążeniem informacyjnym.

Statystyka to badanie informacji numerycznych, zwanych danymi. Statystycy gromadzą, organizują i analizują dane. Każda część tego procesu jest również badana. Techniki statystyki są stosowane w wielu innych obszarach wiedzy. Poniżej znajduje się wprowadzenie do niektórych głównych tematów w statystykach.

Populacje i próbki

Jednym z powracających tematów statystyki jest to, że jesteśmy w stanie powiedzieć coś o dużej grupie na podstawie badania stosunkowo niewielkiej części tej grupy. Grupa jako całość jest znana jako populacja. Część badanej przez nas grupy to próba.

Jako przykład tego załóżmy, że chcieliśmy poznać średni wzrost ludzi mieszkających w Stanach Zjednoczonych. Moglibyśmy spróbować zmierzyć ponad 300 milionów ludzi, ale byłoby to niemożliwe. Byłby to logistyczny koszmar przeprowadzający pomiary w taki sposób, aby nikt nie przeoczył i nikt nie został policzony dwukrotnie.

instagram viewer

Ze względu na niemożność zmierzenia wszystkich w Stanach Zjednoczonych zamiast tego moglibyśmy użyć statystyk. Zamiast znajdować wysokości wszystkich w populacji, bierzemy próba statystyczna z kilku tysięcy. Jeśli poprawnie pobraliśmy próbkę populacji, średnia wysokość próby będzie bardzo zbliżona do średniej wysokości populacji.

Pozyskiwanie danych

Aby wyciągać dobre wnioski, potrzebujemy dobrych danych do pracy. Sposób, w jaki próbkujemy populację w celu uzyskania tych danych, powinien być zawsze analizowany. Rodzaj użytej próbki zależy od tego, jakie pytanie zadajemy na temat populacji. Najczęściej używane próbki to:

  • Prosty losowy
  • Warstwowy
  • Zgrupowane

Równie ważne jest, aby wiedzieć, w jaki sposób przeprowadzany jest pomiar próbki. Wracając do powyższego przykładu, w jaki sposób zdobywamy wysokość osób w naszej próbie?

  • Czy pozwalamy ludziom zgłaszać swój wzrost w kwestionariuszu?
  • Czy kilku badaczy w całym kraju mierzy różnych ludzi i podaje ich wyniki?
  • Czy pojedynczy badacz mierzy wszystkich w próbie za pomocą tej samej taśmy mierniczej?

Każdy z tych sposobów pozyskiwania danych ma swoje zalety i wady. Każdy, kto korzysta z danych z tego badania, chciałby wiedzieć, jak je uzyskano.

Porządkowanie danych

Czasami jest wiele danych i możemy dosłownie zagubić się we wszystkich szczegółach. Las jest trudny do zobaczenia. Dlatego ważne jest, aby nasze dane były dobrze zorganizowane. Staranna organizacja i wyświetlacze graficzne danych pomaga nam dostrzec wzorce i trendy, zanim faktycznie wykonamy jakiekolwiek obliczenia.

Ponieważ sposób, w jaki prezentujemy graficznie nasze dane, zależy od wielu czynników. Typowe wykresy to:

  • Wykresy kołowe lub kołowe
  • Wykresy słupkowe lub pareto
  • Wykresy rozrzutu
  • Wykresy czasowe
  • Wykresy łodyg i liści
  • Wykresy pudełek i wąsów

Oprócz tych dobrze znanych wykresów istnieją inne, które są używane w wyspecjalizowanych sytuacjach.

Opisowe statystyki

Jednym ze sposobów analizy danych jest statystyka opisowa. Tutaj celem jest obliczenie ilości, które opisują nasze dane. Liczby nazywane średnią mediana i tryb są używane do wskazania średni lub centrum danych. Zakres i odchylenie standardowe służą do określenia stopnia rozłożenia danych. Bardziej skomplikowane techniki, takie jak korelacja a regresja opisuje sparowane dane.

Statystyki wnioskowania

Kiedy zaczynamy od próbki, a następnie próbujemy wnioskować coś o populacji, używamy wnioskowanie statystyczne. Pracując z tym obszarem statystyki, temat testowanie hipotez powstaje. Tutaj widzimy naukową naturę przedmiotu statystyki, gdy stawiamy hipotezę, a następnie używamy narzędzia statystyczne z naszą próbką w celu ustalenia prawdopodobieństwa, że ​​musimy odrzucić hipotezę lub nie. Wyjaśnienie to po prostu zarysowuje powierzchnię tej bardzo przydatnej części statystyki.

Zastosowania statystyki

Nie jest przesadą stwierdzenie, że z narzędzi statystycznych korzysta prawie każda dziedzina badań naukowych. Oto kilka obszarów, które w dużej mierze opierają się na statystykach:

  • Psychologia
  • Ekonomia
  • Lekarstwo
  • Reklama
  • Demografia

Podstawy statystyki

Chociaż niektórzy uważają statystyki za gałąź matematyki, lepiej myśleć o niej jako o dyscyplinie opartej na matematyce. W szczególności statystyki są tworzone z dziedziny matematyki znanej jako prawdopodobieństwo. Prawdopodobieństwo pozwala nam określić prawdopodobieństwo wystąpienia zdarzenia. To także pozwala nam mówić o przypadkowości. Jest to klucz do statystyki, ponieważ typowa próbka musi być losowo wybierana z populacji.

Prawdopodobieństwo zostało po raz pierwszy zbadane w 1700 roku przez matematyków takich jak Pascal i Fermat. Lata 1700 to także początek statystyk. Statystyki nadal rosły od początków prawdopodobieństwa i naprawdę zaczęły się rozwijać w XIX wieku. Obecnie zakres teoretyczny jest nadal rozszerzany o tak zwane statystyki matematyczne.