Istnieje wiele pomiarów rozproszenia lub dyspersji w statystykach. Chociaż zasięg i odchylenie standardowe są najczęściej używane, istnieją inne sposoby oceny dyspersji. Przyjrzymy się, jak obliczyć średnie bezwzględne odchylenie dla zestawu danych.
Definicja
Zaczynamy od definicji średniego bezwzględnego odchylenia, które jest również określane jako średnie bezwzględne odchylenie. Wzór przedstawiony w tym artykule jest formalną definicją średniego bezwzględnego odchylenia. Bardziej sensowne może być rozważenie tej formuły jako procesu lub serii kroków, które możemy wykorzystać do uzyskania naszej statystyki.
- Zaczynamy od średnia lub pomiar środka, zbioru danych, który oznaczymy m.
- Następnie sprawdzamy, o ile każda z wartości danych odbiega m. Oznacza to, że bierzemy różnicę między każdą z wartości danych a m.
- Następnie bierzemy całkowita wartość każdej różnicy z poprzedniego kroku. Innymi słowy, upuszczamy wszelkie znaki ujemne dla którejkolwiek z różnic. Powodem tego jest to, że istnieją pozytywne i negatywne odchylenia od m. Jeśli nie wymyślimy sposobu na wyeliminowanie znaków ujemnych, wszystkie odchylenia anulują się nawzajem, jeśli dodamy je razem.
- Teraz sumujemy wszystkie te wartości bezwzględne.
- Na koniec dzielimy tę sumę przez n, czyli całkowita liczba wartości danych. Wynikiem jest średnie bezwzględne odchylenie.
Wariacje
Istnieje kilka wariantów powyższego procesu. Pamiętaj, że nie określiliśmy dokładnie co m jest. Powodem tego jest to, że moglibyśmy użyć różnych statystyk dla m. Zazwyczaj jest to centrum naszego zestawu danych, dlatego można zastosować dowolny z pomiarów tendencji centralnej.
Najczęstszymi statystycznymi pomiarami środka zestawu danych są średnia, mediana i tryb. Tak więc każdy z nich może być użyty jako m przy obliczaniu średniego odchylenia bezwzględnego. Dlatego powszechne jest odniesienie do średniego bezwzględnego odchylenia względem średniej lub średniego bezwzględnego odchylenia względem mediany. Zobaczymy kilka przykładów tego.
Przykład: Średnie bezwzględne odchylenie dotyczące średniej
Załóżmy, że zaczynamy od następującego zestawu danych:
1, 2, 2, 3, 5, 7, 7, 7, 7, 9.
Średnia tego zestawu danych wynosi 5. Poniższa tabela uporządkuje naszą pracę przy obliczaniu średniego bezwzględnego odchylenia względem średniej.
Wartość danych | Odchylenie od średniej | Bezwzględna wartość odchylenia |
1 | 1 - 5 = -4 | |-4| = 4 |
2 | 2 - 5 = -3 | |-3| = 3 |
2 | 2 - 5 = -3 | |-3| = 3 |
3 | 3 - 5 = -2 | |-2| = 2 |
5 | 5 - 5 = 0 | |0| = 0 |
7 | 7 - 5 = 2 | |2| = 2 |
7 | 7 - 5 = 2 | |2| = 2 |
7 | 7 - 5 = 2 | |2| = 2 |
7 | 7 - 5 = 2 | |2| = 2 |
9 | 9 - 5 = 4 | |4| = 4 |
Suma absolutnych odchyleń: | 24 |
Teraz dzielimy tę sumę przez 10, ponieważ istnieje łącznie dziesięć wartości danych. Średnie bezwzględne odchylenie względem średniej wynosi 24/10 = 2,4.
Przykład: Średnie bezwzględne odchylenie dotyczące średniej
Teraz zaczynamy od innego zestawu danych:
1, 1, 4, 5, 5, 5, 5, 7, 7, 10.
Podobnie jak w poprzednim zestawie danych, średnia tego zestawu danych wynosi 5.
Wartość danych | Odchylenie od średniej | Bezwzględna wartość odchylenia |
1 | 1 - 5 = -4 | |-4| = 4 |
1 | 1 - 5 = -4 | |-4| = 4 |
4 | 4 - 5 = -1 | |-1| = 1 |
5 | 5 - 5 = 0 | |0| = 0 |
5 | 5 - 5 = 0 | |0| = 0 |
5 | 5 - 5 = 0 | |0| = 0 |
5 | 5 - 5 = 0 | |0| = 0 |
7 | 7 - 5 = 2 | |2| = 2 |
7 | 7 - 5 = 2 | |2| = 2 |
10 | 10 - 5 = 5 | |5| = 5 |
Suma absolutnych odchyleń: | 18 |
Zatem średnie bezwzględne odchylenie względem średniej wynosi 18/10 = 1,8. Porównujemy ten wynik do pierwszego przykładu. Chociaż średnia była identyczna dla każdego z tych przykładów, dane w pierwszym przykładzie były bardziej rozłożone. Z tych dwóch przykładów widzimy, że średnie bezwzględne odchylenie od pierwszego przykładu jest większe niż średnie bezwzględne odchylenie od drugiego przykładu. Im większe średnie bezwzględne odchylenie, tym większe rozproszenie naszych danych.
Przykład: Średnie bezwzględne odchylenie dotyczące mediany
Zacznij od tego samego zestawu danych, co w pierwszym przykładzie:
1, 2, 2, 3, 5, 7, 7, 7, 7, 9.
Mediana zbioru danych wynosi 6. W poniższej tabeli przedstawiamy szczegóły obliczenia średniego bezwzględnego odchylenia względem mediany.
Wartość danych | Odchylenie od mediany | Bezwzględna wartość odchylenia |
1 | 1 - 6 = -5 | |-5| = 5 |
2 | 2 - 6 = -4 | |-4| = 4 |
2 | 2 - 6 = -4 | |-4| = 4 |
3 | 3 - 6 = -3 | |-3| = 3 |
5 | 5 - 6 = -1 | |-1| = 1 |
7 | 7 - 6 = 1 | |1| = 1 |
7 | 7 - 6 = 1 | |1| = 1 |
7 | 7 - 6 = 1 | |1| = 1 |
7 | 7 - 6 = 1 | |1| = 1 |
9 | 9 - 6 = 3 | |3| = 3 |
Suma absolutnych odchyleń: | 24 |
Ponownie dzielimy sumę przez 10 i otrzymujemy średnie średnie odchylenie wokół mediany jako 24/10 = 2,4.
Przykład: Średnie bezwzględne odchylenie dotyczące mediany
Zacznij od tego samego zestawu danych, co wcześniej:
1, 2, 2, 3, 5, 7, 7, 7, 7, 9.
Tym razem tryb tego zestawu danych to 7. W poniższej tabeli pokazujemy szczegóły obliczenia średniego bezwzględnego odchylenia dotyczącego trybu.
Dane | Odchylenie od trybu | Bezwzględna wartość odchylenia |
1 | 1 - 7 = -6 | |-5| = 6 |
2 | 2 - 7 = -5 | |-5| = 5 |
2 | 2 - 7 = -5 | |-5| = 5 |
3 | 3 - 7 = -4 | |-4| = 4 |
5 | 5 - 7 = -2 | |-2| = 2 |
7 | 7 - 7 = 0 | |0| = 0 |
7 | 7 - 7 = 0 | |0| = 0 |
7 | 7 - 7 = 0 | |0| = 0 |
7 | 7 - 7 = 0 | |0| = 0 |
9 | 9 - 7 = 2 | |2| = 2 |
Suma absolutnych odchyleń: | 22 |
Dzielimy sumę absolutnych odchyleń i widzimy, że mamy średnie bezwzględne odchylenie dotyczące trybu 22/10 = 2,2.
Szybkie fakty
Istnieje kilka podstawowych właściwości dotyczących średnich odchyleń bezwzględnych
- Średnie bezwzględne odchylenie względem mediany jest zawsze mniejsze lub równe średniemu bezwzględnemu odchyleniu wokół średniej.
- Odchylenie standardowe jest większe lub równe średniemu absolutnemu odchyleniu względem średniej.
- Średnie bezwzględne odchylenie jest czasami skracane przez MAD. Niestety może to być niejednoznaczne, ponieważ MAD może na przemian odnosić się do mediany bezwzględnego odchylenia.
- Średnie bezwzględne odchylenie dla rozkładu normalnego jest około 0,8 razy większe niż odchylenie standardowe.
Typowe zastosowania
Średnie bezwzględne odchylenie ma kilka zastosowań. Pierwsza aplikacja polega na tym, że ta statystyka może zostać wykorzystana do nauczenia niektórych pomysłów odchylenie standardowe. Średnie bezwzględne odchylenie względem średniej jest znacznie łatwiejsze do obliczenia niż odchylenie standardowe. Nie wymaga od nas kwadratowania odchyleń i nie musimy znajdować pierwiastka kwadratowego na końcu naszych obliczeń. Co więcej, średnie bezwzględne odchylenie jest bardziej intuicyjnie związane z rozprzestrzenianiem się zestawu danych niż to, co jest odchyleniem standardowym. Właśnie dlatego średnie odchylenie absolutne jest czasami nauczane najpierw, zanim zostanie wprowadzone odchylenie standardowe.
Niektórzy posunęli się nawet do twierdzenia, że odchylenie standardowe należy zastąpić średnim odchyleniem bezwzględnym. Chociaż odchylenie standardowe jest ważne w zastosowaniach naukowych i matematycznych, nie jest tak intuicyjne jak średnie odchylenie absolutne. W codziennych zastosowaniach średnie bezwzględne odchylenie jest bardziej namacalnym sposobem pomiaru stopnia rozproszenia danych.