To północny pokaz najnowszego hitu filmowego. Ludzie ustawiają się w kolejce przed teatrem, czekając na wejście. Załóżmy, że zostałeś poproszony o znalezienie środka linii. Jak byś to zrobił?
Istnieje kilka różnych sposobów postępowania rozwiązanie tego problemu. Na koniec musisz dowiedzieć się, ile osób było na linii, a następnie wziąć połowę tej liczby. Jeśli łączna liczba jest parzysta, wówczas środek linii znajdowałby się między dwiema osobami. Jeśli łączna liczba jest nieparzysta, centrum będzie pojedyncza osoba.
Możesz zapytać: „Z czym wiąże się znalezienie środka linii Statystyka? ”Pomysł znalezienia centrum jest dokładnie tym, czego używa się przy obliczaniu mediany zbioru danych.
Co to jest mediana?
Mediana jest jednym z trzech głównych sposobów na znalezienie średniej dane statystyczne. Jest trudniejszy do obliczenia niż tryb, ale nie jest tak pracochłonny jak obliczanie średniej. Jest to centrum w taki sam sposób, jak znalezienie centrum linii ludzi. Po wyszczególnieniu wartości danych w porządku rosnącym, mediana jest wartością danych z taką samą liczbą wartości danych powyżej i poniżej.
Przypadek pierwszy: nieparzysta liczba wartości
Jedenaście akumulatorów jest testowanych, aby sprawdzić, jak długo działają. Ich czasy życia, w godzinach, podaje 10, 99, 100, 103, 103, 105, 110, 111, 115, 130, 131. Jaka jest mediana życia? Ponieważ istnieje nieparzysta liczba wartości danych, odpowiada to linii z nieparzystą liczbą osób. Centrum będzie środkową wartością.
Istnieje jedenaście wartości danych, więc szósta jest w centrum. Dlatego mediana czasu pracy baterii jest szóstą wartością na tej liście lub 105 godzin. Należy zauważyć, że mediana jest jedną z wartości danych.
Przypadek drugi: parzysta liczba wartości
Waży się 20 kotów. Ich wagi, w funtach, są podane przez 4, 5, 5, 5, 6, 6, 6, 7, 7, 7, 8, 8, 9, 10, 10, 10, 11, 12, 12, 13. Jaka jest średnia waga kotów? Ponieważ istnieje parzysta liczba wartości danych, odpowiada to linii z parzystą liczbą osób. Środek znajduje się między dwiema wartościami środkowymi.
W tym przypadku środek znajduje się między dziesiątą a jedenastą wartością danych. Aby znaleźć medianę, obliczamy średnią z tych dwóch wartości i otrzymujemy (7 + 8) / 2 = 7,5. W tym przypadku mediana nie jest jedną z wartości danych.
Jakieś inne przypadki?
Jedyne dwie możliwości to parzysta lub nieparzysta liczba wartości danych. Zatem powyższe dwa przykłady są jedynymi możliwymi sposobami obliczenia mediany. Albo mediana będzie średnią wartością, albo mediana będzie średnia z dwóch średnie wartości. Zazwyczaj zestawy danych są znacznie większe niż te, które omówiliśmy powyżej, ale proces znajdowania mediany jest taki sam jak w tych dwóch przykładach.
Wpływ wartości odstających
Średnia i tryb są bardzo wrażliwe na wartości odstające. Oznacza to, że obecność wartości odstającej dramatycznie wpłynie na obie te miary centrum. Jedną z zalet mediany jest to, że wartość odstająca nie ma na nią tak dużego wpływu.
Aby to zobaczyć, rozważ zestaw danych 3, 4, 5, 5, 6. Średnia wynosi (3 + 4 + 5 + 5 + 6) / 5 = 4,6, a mediana wynosi 5. Teraz zachowaj ten sam zestaw danych, ale dodaj wartość 100: 3, 4, 5, 5, 6, 100. Wyraźnie 100 jest wartością odstającą, ponieważ jest znacznie większa niż wszystkie inne wartości. Średnia nowego zestawu wynosi teraz (3 + 4 + 5 + 5 + 6 + 100) / 6 = 20,5. Jednakże mediana nowego zestawu wynosi 5. Chociaż
Zastosowanie mediany
Z powodu tego, co widzieliśmy powyżej, mediana jest preferowaną miarą średniej, gdy dane zawierają wartości odstające. W przypadku zgłaszania dochodów typowym podejściem jest podawanie mediany dochodu. Dzieje się tak, ponieważ średni dochód jest wypaczony przez niewielką liczbę osób o bardzo wysokich dochodach (pomyśl Bill Gates i Oprah).