Co to jest skośność w statystykach?

Niektóre dystrybucje danych, takie jak krzywa dzwonowa lub normalna dystrybucja, są symetryczne. Oznacza to, że prawa i lewa część dystrybucji to doskonałe lustrzane odbicia. Nie każda dystrybucja danych jest symetryczna. Zestawy danych, które nie są symetryczne, uważa się za asymetryczne. Miarą asymetrii rozkładu może być skośność.

Średnia, mediana i tryb są wszystkie środki centrum zestawu danych. Skośność danych można określić na podstawie tego, w jaki sposób te wielkości są ze sobą powiązane.

Przekrzywiony w prawo

Dane przekrzywione w prawo mają długi ogon, który rozciąga się w prawo. Alternatywnym sposobem mówienia o zestawie danych pochylonym w prawo jest stwierdzenie, że jest on wypaczony pozytywnie. W tej sytuacji średnia i mediana oba są większe niż tryb. Zasadniczo w większości przypadków dane są przekrzywione w prawo, średnia będzie większa niż mediana. Podsumowując, dla zestawu danych pochylonego w prawo:

  • Zawsze: oznacza większy niż tryb
  • Zawsze: mediana większa niż tryb
  • Przez większość czasu: średnia większa niż mediana
instagram viewer

Przekrzywiony w lewo

Sytuacja odwraca się, gdy mamy do czynienia z danymi przekrzywionymi w lewo. Dane przekrzywione w lewo mają długi ogon, który rozciąga się w lewo. Alternatywnym sposobem mówienia o zestawie danych pochylonym w lewo jest stwierdzenie, że jest on wypaczony negatywnie. W tej sytuacji średnia i mediana są mniejsze niż tryb. Zasadniczo w większości przypadków dane są przekrzywione w lewo, średnia będzie mniejsza niż mediana. Podsumowując, dla zestawu danych pochylonego w lewo:

  • Zawsze: oznacza mniej niż tryb
  • Zawsze: mediana mniejsza niż tryb
  • Przez większość czasu: oznacza mniej niż mediana

Miary Skośności

Jedną rzeczą jest przyjrzeć się dwóm zestawom danych i ustalić, że jeden jest symetryczny, a drugi asymetryczny. Kolejne jest spojrzenie na dwa zestawy danych asymetrycznych i stwierdzenie, że jeden jest bardziej przekrzywiony niż drugi. Bardzo subiektywne może być ustalenie, który jest bardziej wypaczony, po prostu patrząc na wykres rozkładu. Właśnie dlatego istnieją sposoby obliczenia liczbowego miary skośności.

Jedną miarą skośności, zwaną pierwszym współczynnikiem skośności Pearsona, jest odjęcie średniej z trybu, a następnie podzielenie tej różnicy przez odchylenie standardowe danych. Powodem podziału różnicy jest to, że mamy bezwymiarową ilość. To wyjaśnia, dlaczego dane przekrzywione w prawo mają dodatnią skośność. Jeśli zestaw danych jest przekrzywiony w prawo, średnia jest większa niż tryb, a zatem odjęcie trybu od średniej daje liczbę dodatnią. Podobny argument wyjaśnia, dlaczego dane przekrzywione w lewo mają skośność ujemną.

Drugi współczynnik skośności Pearsona służy również do pomiaru asymetrii zbioru danych. Dla tej ilości odejmujemy tryb od mediany, mnożymy tę liczbę przez trzy, a następnie dzielimy przez odchylenie standardowe.

Zastosowania skośnych danych

Przekrzywione dane powstają całkiem naturalnie w różnych sytuacjach. Dochody są przekrzywione w prawo, ponieważ nawet kilka osób, które zarabiają miliony dolarów, może znacznie wpłynąć na średnią i nie ma ujemnych dochodów. Podobnie dane dotyczące okresu użytkowania produktu, na przykład marki żarówki, są przekrzywione w prawo. W tym przypadku najmniejsze, jakie może trwać całe życie, to zero, a długotrwałe żarówki nadadzą pozytywny skośność danym.

instagram story viewer