Wprowadzenie do zakresu międzykwartylowego

Zakres międzykwartylowy (IQR) to różnica między pierwszym kwartylem a trzecim kwartylem. Wzór na to jest następujący:

IQR = Q3 - Q1

Istnieje wiele pomiarów zmienności zestawu danych. Oboje zasięg i odchylenie standardowe powiedz nam, jak rozłożone są nasze dane. Problem z tymi statystykami opisowymi polega na tym, że są one dość wrażliwe na wartości odstające. Miarą rozprzestrzeniania się zestawu danych, który jest bardziej odporny na obecność wartości odstających, jest zakres międzykwartylowy.

Definicja zakresu międzykwartylowego

Jak widać powyżej, zakres międzykwartylowy opiera się na obliczeniach innych statystyk. Przed określeniem zakresu międzykwartylowego musimy najpierw poznać wartości pierwszego kwartylu i trzeciego kwartylu. (Oczywiście pierwszy i trzeci kwartyl zależą od wartości mediany).

Po ustaleniu wartości pierwszego i trzeciego kwartylu zakres międzykwartylowy jest bardzo łatwy do obliczenia. Wszystko, co musimy zrobić, to odjąć pierwszy kwartyl od trzeciego kwartylu. To tłumaczy użycie terminu zakres międzykwartylowy dla tej statystyki.

instagram viewer

Przykład

Aby zobaczyć przykład obliczenia zakresu międzykwartylowego, rozważymy zestaw danych: 2, 3, 3, 4, 5, 6, 6, 7, 8, 8, 8, 9. The pięć liczb dla tego zestawu danych jest:

  • Minimum 2
  • Pierwszy kwartyl 3.5
  • Mediana 6
  • Trzeci kwartyl 8
  • Maksymalnie 9

Widzimy zatem, że przedział międzykwartylowy wynosi 8 - 3,5 = 4,5.

Znaczenie zakresu międzykwartylowego

Zakres daje nam pomiar tego, jak rozproszony jest cały nasz zestaw danych. Zakres międzykwartylowy, który mówi nam, jak daleko od siebie pierwszy i trzeci kwartyl są, wskazuje, jak rozłożone jest 50% naszego zestawu danych.

Odporność na wartości odstające

Podstawową zaletą stosowania zakresu międzykwartylowego zamiast zakresu do pomiaru rozproszenia zbioru danych jest to, że zakres międzykwartylowy nie jest wrażliwy na wartości odstające. Aby to zobaczyć, przyjrzymy się przykładowi.

Z powyższego zestawu danych mamy przedział międzykwartylowy 3,5, zakres 9 - 2 = 7 i odchylenie standardowe 2,34. Jeśli zamienimy najwyższą wartość 9 na skrajną wartość odstającą 100, wówczas odchylenie standardowe wynosi 27,37, a zakres wynosi 98. Mimo że mamy dość drastyczne przesunięcia tych wartości, pierwszy i trzeci kwartyl pozostają nienaruszone, a zatem zakres międzykwartylowy nie ulega zmianie.

Zastosowanie zakresu międzykwartylowego

Poza tym, że jest mniej wrażliwą miarą rozprzestrzeniania się zestawu danych, zakres międzykwartylowy ma również inne ważne zastosowanie. Ze względu na swoją odporność na wartości odstające, przedział międzykwartylowy jest przydatny do identyfikacji, kiedy wartość jest wartością odstającą.

The reguła zakresu międzykwartylowego to informuje nas, czy mamy łagodny czy silny odstający wynik. Aby znaleźć wartość odstającą, musimy spojrzeć poniżej pierwszego kwartylu lub powyżej trzeciego kwartylu. To, jak daleko powinniśmy pójść, zależy od wartości zakresu międzykwartylowego.

instagram story viewer