Normalny rozkład danych to taki, w którym większość punktów danych jest stosunkowo podobna, co oznacza, że występują w niewielkim zakresie wartości z mniejszymi wartościami odstającymi na górnych i dolnych końcach zakres danych.
Gdy dane są zwykle dystrybuowane, wykreślając je na wykresie, powstaje symetryczny obraz w kształcie dzwonu, często nazywany krzywą dzwonową. W takiej dystrybucji danych średnia, mediana i tryb wszystkie mają tę samą wartość i pokrywają się ze szczytem krzywej.
Jednak w naukach społecznych normalny rozkład jest bardziej teoretycznym ideałem niż zwykłą rzeczywistością. Pojęcie i zastosowanie go jako soczewki do badania danych odbywa się za pomocą użytecznego narzędzia do identyfikacji i wizualizowanie norm i trendy w zbiorze danych.
Właściwości rozkładu normalnego
Jedną z najbardziej zauważalnych cech normalnego rozkładu jest jego kształt i idealna symetria. Jeśli złożysz zdjęcie o rozkładzie normalnym dokładnie pośrodku, otrzymasz dwie równe połówki, z których każda jest lustrzanym odbiciem drugiej. Oznacza to również, że połowa obserwacji w danych przypada po obu stronach środka rozkładu.
Punkt środkowy rozkładu normalnego to punkt, który ma maksymalną częstotliwość, co oznacza liczbę lub kategorię odpowiedzi z największą liczbą obserwacji dla tej zmiennej. Punkt środkowy rozkładu normalnego jest także punktem, w którym spadają trzy miary: średnia, mediana i tryb. W całkowicie normalnym rozkładzie wszystkie trzy miary mają tę samą liczbę.
We wszystkich rozkładach normalnych lub prawie normalnych istnieje stała proporcja powierzchni pod krzywą leżąca między średnią a dowolną daną odległością od średniej, mierzoną w standardowe jednostki odchylenia. Na przykład we wszystkich krzywych normalnych 99,73 procent wszystkich przypadków mieści się w trzech standardowych odchyleniach od średniej, 95,45 procent wszystkie przypadki mieszczą się w dwóch standardowych odchyleniach od średniej, a 68,27 procent przypadków mieści się w jednym standardowym odchyleniu od średniej oznaczać.
Rozkłady normalne są często reprezentowane w wyniku standardowym lub wyniku Z, które są liczbami, które mówią nam odległość między faktycznym wynikiem a średnią w kategoriach odchyleń standardowych. Standardowy rozkład normalny ma średnią 0,0 i odchylenie standardowe 1,0.
Przykłady i zastosowanie w naukach społecznych
Chociaż rozkład normalny jest teoretyczny, istnieje kilka zmiennych, które badacze badają, które bardzo przypominają krzywą normalną. Na przykład standardowe wyniki testów, takie jak SAT, ACT i GRE, zwykle przypominają rozkład normalny. Wzrost, sprawność sportowa oraz liczne postawy społeczne i polityczne danej populacji również zwykle przypominają krzywą dzwonową.
Ideał rozkładu normalnego jest również przydatny jako punkt porównania, gdy dane nie są normalnie dystrybuowane. Na przykład większość ludzi zakłada, że rozkład dochodu gospodarstwa domowego w USA byłby rozkładem normalnym i przypominałby krzywą dzwonową po wykreśleniu na wykresie. Oznaczałoby to, że większość obywateli USA zarabia w średnim przedziale dochodów, czyli innymi słowy, że istnieje zdrowa klasa średnia. Tymczasem liczba osób z niższych klas ekonomicznych byłaby niewielka, podobnie jak liczba z wyższych klas. Jednak rzeczywisty rozkład dochodów gospodarstw domowych w USA wcale nie przypomina krzywej dzwonowej. Większość gospodarstw domowych należy do niski do dolnego środkowego zakresu, co oznacza, że jest więcej biednych ludzi walczących o przetrwanie niż ludzi żyjących wygodnie w klasie średniej. W takim przypadku ideał rozkładu normalnego jest użyteczny do zilustrowania nierówności dochodów.