Dziedzina statystyki jest podzielona na dwa główne działy: opisowy i wnioskowy. Każdy z tych segmentów jest ważny, oferując różne techniki pozwalające osiągnąć różne cele. Statystyki opisowe opisują, co się dzieje w populacja lub zbiór danych. Natomiast statystyki wnioskowania pozwalają naukowcom wziąć wyniki z grupy próbnej i uogólnić je na większą populację. Te dwa rodzaje statystyk mają pewne ważne różnice.
Opisowe statystyki
Statystyka opisowa to rodzaj statystyki, która prawdopodobnie przychodzi do głowy większości ludzi, gdy słyszą słowo „statystyki”. W tej gałęzi statystyki celem jest opisanie. Miarę numeryczną stosuje się do opisania cech zestawu danych. Istnieje wiele pozycji, które należą do tej części statystyk, takich jak:
- The średnilub miara środka zestawu danych, składającego się ze średniej, mediany, trybu lub średnicy
- Rozpiętość zestawu danych, którą można zmierzyć za pomocą zasięg lub odchylenie standardowe
- Ogólne opisy danych, takie jak pięć liczb
- Pomiary takie jak skośność i kurtoza
- Badanie relacji i korelacja pomiędzy sparowanymi danymi
- Prezentacja wyników statystycznych w graficzny Formularz
Miary te są ważne i przydatne, ponieważ pozwalają naukowcom zobaczyć wzorce między danymi, a tym samym nadać im sens. Statystyki opisowe można wykorzystać wyłącznie do opisania populacji lub zbioru danych objętych badaniem: wyników nie można uogólnić na żadną inną grupę lub populację.
Rodzaje statystyki opisowej
Istnieją dwa rodzaje statystyk opisowych, których używają naukowcy społeczni:
Miary tendencji centralnej przechwytują ogólne trendy w danych i są obliczane i wyrażane jako średnia, mediana i tryb. Średnia mówi naukowcom średnią matematyczną wszystkich zbiorów danych, takich jak średni wiek w pierwszym małżeństwie; mediana reprezentuje środek rozkładu danych, na przykład wiek, który znajduje się w środku przedziału wiekowego, w którym ludzie po raz pierwszy się pobierają; tryb może być najczęstszym wiekiem, w którym ludzie po raz pierwszy biorą ślub.
Miary rozprzestrzeniania opisują sposób dystrybucji danych i odnoszą się do siebie, w tym:
- Zakres, cały zakres wartości obecnych w zbiorze danych
- Rozkład częstotliwości, który określa, ile razy określona wartość występuje w zbiorze danych
- Kwartyle, podgrupy utworzone w zbiorze danych, gdy wszystkie wartości są podzielone na cztery równe części w całym zakresie
- Średnie odchylenie bezwzględne, średnia o ile każda wartość odbiega od średniej
- Zmienność, który pokazuje, jak duży jest spread w danych
- Odchylenie standardowe, które ilustruje rozkład danych w stosunku do średniej
Miary rozprzestrzeniania są często przedstawiane wizualnie w tabelach, wykresach kołowych i słupkowych oraz histogramach, aby pomóc w zrozumieniu trendów w danych.
Statystyki wnioskowania
Statystyki wnioskowania są tworzone na podstawie złożonych obliczeń matematycznych, które pozwalają naukowcom wnioskować o trendach dotyczących większej populacji na podstawie badania pobranej z niej próbki. Naukowcy używają wnioskowania statystycznego do badania związków między zmiennymi w próbce a następnie dokonaj uogólnień lub prognoz dotyczących tego, jak zmienne te odnoszą się do większej populacja.
Zazwyczaj niemożliwe jest zbadanie każdego członka populacji indywidualnie. Dlatego naukowcy wybierają reprezentatywny podzbiór populacji, zwany próbką statystyczną, i na podstawie tej analizy są w stanie powiedzieć coś o populacji, z której pochodzi próbka. Istnieją dwa główne działy wnioskowania statystycznego:
- Przedział ufności podaje zakres wartości dla nieznanego parametru populacji poprzez pomiar próby statystycznej. Wyraża się to jako przedział i stopień pewności, że parametr mieści się w przedziale.
- Testy istotności lub testowanie hipotez gdzie naukowcy twierdzą o populacji, analizując próbkę statystyczną. Z założenia w tym procesie występuje niepewność. Można to wyrazić jako poziom istotności.
Techniki stosowane przez naukowców społecznych do badania związków między zmiennymi, a tym samym do tworzenia wnioskowania statystycznego, obejmują analizy regresji liniowej, analizy regresji logistycznej, ANOVA, analizy korelacji, modelowanie równań strukturalnychi analiza przeżycia. Prowadząc badania przy użyciu wnioskowania statystycznego, naukowcy przeprowadzają test istotności, aby ustalić, czy mogą uogólnić swoje wyniki na większą populację. Typowe testy istotności obejmują chi-kwadrat i test t. Mówią one naukowcom o prawdopodobieństwie, że wyniki ich analizy próbki będą reprezentatywne dla całej populacji.
Opisowy vs. Statystyki wnioskowania
Chociaż statystyki opisowe są pomocne w uczeniu się takich rzeczy, jak rozprzestrzenianie się i centrum danych, nic w statystykach opisowych nie może być wykorzystane do jakichkolwiek uogólnień. W statystyce opisowej pomiary, takie jak średnia i odchylenie standardowe, są podawane jako dokładne liczby.
Mimo że statystyki wnioskowania wykorzystują podobne obliczenia - takie jak średnia i odchylenie standardowe - w przypadku statystyk wnioskowania sytuacja jest inna. Statystyki wnioskowania rozpoczynają się od próby, a następnie generalizują według populacji. Ta informacja o populacji nie jest podana jako liczba. Zamiast tego naukowcy wyrażają te parametry jako zakres potencjalnych liczb wraz ze stopniem pewności.