Zakres zestawów danych statystycznych

W statystyce i matematyce zakres jest różnicą między maksymalnymi i minimalnymi wartościami zestawu danych i służy jako jedna z dwóch ważnych cech zestawu danych. Wzór na zakres jest wartością maksymalną minus wartość minimalną w zbiorze danych, co zapewnia statystykom lepsze zrozumienie, jak różnorodny jest zestaw danych.

Dwie ważne cechy zestawu danych obejmują centrum danych i ich rozprzestrzenianie, a centrum może byćmierzone na wiele sposobów: najpopularniejsze z nich to średnia, mediana, tryb i środek pasma, ale w podobny sposób istnieją różne sposoby obliczania rozłożenia zbioru danych, a najłatwiejszą i najokrutniejszą miarą rozrzutu jest zakres.

Obliczenie zakresu jest bardzo proste. Wszystko, co musimy zrobić, to znaleźć różnicę między największą wartością danych w naszym zestawie a najmniejszą wartością danych. Mówiąc zwięźle mamy następujący wzór: Zakres = wartość maksymalna – wartość minimalna. Na przykład zestaw danych 4, 6, 10, 15, 18 ma maksymalnie 18, minimum 4 i zakres 18-4 = 14.

instagram viewer

Zakres jest bardzo przybliżonym pomiarem rozprzestrzeniania się danych, ponieważ jest wyjątkowo wrażliwy na wartości odstające, w wyniku czego istnieją pewne ograniczenia użyteczności prawdziwego zakresu zestawu danych dla statystów, ponieważ pojedyncza wartość danych może znacznie wpłynąć na wartość zasięg.

Weźmy na przykład zestaw danych 1, 2, 3, 4, 6, 7, 7, 8. Maksymalna wartość to 8, minimum to 1, a zakres to 7. Następnie rozważ ten sam zestaw danych, z uwzględnieniem tylko wartości 100. Zakres staje się teraz 100-1 = 99 przy czym dodanie jednego dodatkowego punktu danych znacznie wpłynęło na wartość zakresu. Odchylenie standardowe jest kolejną miarą rozproszenia, która jest mniej podatna na wartości odstające, ale wadą jest to, że obliczenie odchylenia standardowego jest znacznie bardziej skomplikowane.

Zakres mówi nam również nic o wewnętrznych funkcjach naszego zestawu danych. Na przykład rozważamy zestaw danych 1, 1, 2, 3, 4, 5, 5, 6, 7, 8, 8, 10, gdzie zakres dla tego zestawu danych wynosi 10-1 = 9. Jeśli porównamy to z zestawem danych 1, 1, 1, 2, 9, 9, 9, 10. Tutaj zakres znów wynosi dziewięć dla tego drugiego zestawu i, w przeciwieństwie do pierwszego zestawu, dane są skupione wokół minimum i maksimum. Inne statystyki, takie jak pierwszy i trzeci kwartyl, musiałyby zostać wykorzystane do wykrycia części tej wewnętrznej struktury.

Zakres jest dobrym sposobem na bardzo podstawowe zrozumienie, jak naprawdę rozkładają się liczby w zbiorze danych, ponieważ jest to łatwe obliczyć, ponieważ wymaga tylko podstawowej operacji arytmetycznej, ale istnieje również kilka innych zastosowań zakresu zestawu danych w Statystyka.

Zakres można również wykorzystać do oszacowania innej miary rozproszenia, odchylenia standardowego. Zamiast przechodzić przez dość skomplikowaną formułę w celu znalezienia standardowego odchylenia, zamiast tego możemy użyć tak zwanego zasada zasięgu. Zakres ma podstawowe znaczenie w tych obliczeniach.

Zakres występuje również w fabuła, lub fabuła pudełka i wąsów. Wartości maksymalne i minimalne są wykreślone na końcu wąsów na wykresie, a całkowita długość wąsów i pudełka jest równa zakresowi.