Zasada zasięgu międzykwartylowego jest przydatna w wykrywaniu obecności wartości odstających. Wartości odstające to indywidualne wartości, które nie mieszczą się w ogólnym wzorze zestawu danych. Ta definicja jest dość niejasna i subiektywna, dlatego warto mieć regułę, która będzie obowiązywać ustalanie, czy punkt danych jest naprawdę wartością odstającą - w tym przypadku obowiązuje zasada zakresu międzykwartylowego wchodzi.
Dowolny zestaw danych można opisać za pomocą pięć liczb. Te pięć liczb, które dostarczają informacji potrzebnych do znalezienia wzorów i wartości odstających, składają się z (w porządku rosnącym):
Te pięć liczb mówi danej osobie więcej o ich danych niż ich jednoczesne spojrzenie na liczby mogłoby, a przynajmniej znacznie ułatwić. Na przykład zasięg, czyli minimum odejmowane od maksimum, jest jednym ze wskaźników rozłożenia danych w zestawie (uwaga: zakres jest bardzo wysoki wrażliwe na wartości odstające - jeśli wartość odstająca jest również wartością minimalną lub maksymalną, zakres nie będzie dokładną reprezentacją szerokości danych zestaw).
W przeciwnym razie zasięg byłby trudny do ekstrapolacji. Zakres międzykwartylowy jest podobny do zakresu, ale mniej wrażliwy na wartości odstające. The zakres międzykwartylowy jest obliczany w podobny sposób jak zakres. Aby go znaleźć, odejmij pierwszy kwartyl od trzeciego kwartylu:
Zakres międzykwartylowy pokazuje rozkład danych na temat mediany. Jest mniej podatny na wartości odstające niż zasięg i dlatego może być bardziej pomocny.
Mimo że nie mają na nie dużego wpływu, zakres międzykwartylowy może być wykorzystywany do wykrywania wartości odstających. Dokonuje się tego, wykonując następujące kroki:
Pamiętaj, że reguła międzykwartylowa jest jedynie praktyczną regułą, która ogólnie obowiązuje, ale nie ma zastosowania do każdego przypadku. Ogólnie rzecz biorąc, należy zawsze śledzić analizę wartości odstających, badając uzyskane wartości odstające, aby sprawdzić, czy mają one sens. Wszelkie potencjalne wartości odstające uzyskane metodą międzykwartylową należy zbadać w kontekście całego zestawu danych.
Zobacz regułę zasięgu międzykwartylowego w pracy z przykładem. Załóżmy, że masz następujący zestaw danych: 1, 3, 4, 6, 7, 7, 8, 8, 10, 12, 17. Pięciocyfrowe podsumowanie tego zestawu danych to minimum = 1, pierwszy kwartyl = 4, mediana = 7, trzeci kwartyl = 10 i maksymalnie = 17. Możesz spojrzeć na dane i automatycznie powiedzieć, że 17 jest wartością odstającą, ale co mówi reguła zakresu międzykwartylowego?
Teraz pomnóż swoją odpowiedź przez 1,5, aby uzyskać 1,5 x 6 = 9. Dziewięć mniej niż pierwszy kwartyl to 4 - 9 = -5. Żadne dane nie są mniejsze niż to. Dziewięć więcej niż trzeci kwartyl to 10 + 9 = 19. Żadne dane nie są większe niż to. Mimo że maksymalna wartość wynosi pięć więcej niż najbliższy punkt danych, reguła zakresu międzykwartylowego pokazuje, że prawdopodobnie nie należy tego traktować jako wartości odstającej dla tego zestawu danych.