Nierówność Czebyszewa mówi, że co najmniej 1-1 /K.2 danych z próbki musi się mieścić K. standardowe odchylenia od średniej (tutaj K. jest jakikolwiek pozytywny prawdziwy numer więcej niż jeden).
Każdy zestaw danych, który jest normalnie dystrybuowany lub ma postać krzywa dzwonowa, ma kilka funkcji. Jeden z nich dotyczy rozłożenia danych w stosunku do liczby odchyleń standardowych od średniej. W rozkładzie normalnym wiemy, że 68% danych to jedno odchylenie standardowe od średniej, 95% to dwa standardowe odchylenia od średniej, a około 99% mieści się w trzech standardowych odchyleniach od średniej.
Ale jeśli zbiór danych nie jest rozłożony w kształcie krzywej dzwonowej, wówczas inna ilość może znajdować się w obrębie jednego odchylenia standardowego. Nierówność Czebyszewa pozwala dowiedzieć się, w jakim ułamku danych się znajduje K. odchylenia standardowe od średniej dla każdy zbiór danych.
Fakty na temat nierówności
Możemy również stwierdzić powyższą nierówność, zastępując wyrażenie „dane z próbki”
rozkład prawdopodobieństwa. Wynika to z faktu, że nierówność Czebyszewa wynika z prawdopodobieństwa, które można następnie zastosować do statystyki.Należy zauważyć, że ta nierówność jest wynikiem udowodnionym matematycznie. To nie jest tak związek empiryczny pomiędzy średnią a trybem lub praktyczna zasada który łączy zakres i odchylenie standardowe.
Ilustracja nierówności
Aby zilustrować nierówność, przyjrzymy się jej kilku wartościom K.:
- Dla K. = 2 mamy 1 - 1 /K.2 = 1 - 1/4 = 3/4 = 75%. Nierówność Czebyszewa mówi, że co najmniej 75% wartości danych dowolnego rozkładu musi mieścić się w dwóch standardowych odchyleniach od średniej.
- Dla K. = 3 mamy 1 - 1 /K.2 = 1 - 1/9 = 8/9 = 89%. Nierówność Czebyszewa mówi, że co najmniej 89% wartości danych dowolnego rozkładu musi mieścić się w trzech standardowych odchyleniach od średniej.
- Dla K. = 4 mamy 1 - 1 /K.2 = 1 - 1/16 = 15/16 = 93.75%. Nierówność Czebyszewa mówi, że co najmniej 93,75% wartości danych dowolnego rozkładu musi mieścić się w dwóch standardowych odchyleniach od średniej.
Przykład
Załóżmy, że pobraliśmy próbki psów w lokalnym schronisku dla zwierząt i stwierdziliśmy, że nasza próbka ma średnią 20 funtów przy standardowym odchyleniu 3 funtów. Dzięki zastosowaniu nierówności Czebyszewa wiemy, że co najmniej 75% psów, z których pobraliśmy próbki, ma masy, które stanowią dwa standardowe odchylenia od średniej. Dwa razy odchylenie standardowe daje nam 2 x 3 = 6. Odejmij i dodaj to od średniej 20. To mówi nam, że 75% psów ma wagę od 14 funtów do 26 funtów.
Wykorzystanie nierówności
Jeśli wiemy więcej o rozkładzie, nad którym pracujemy, zwykle możemy zagwarantować, że więcej danych to pewna liczba standardowych odchyleń od średniej. Na przykład, jeśli wiemy, że mamy rozkład normalny, wówczas 95% danych to dwa standardowe odchylenia od średniej. Nierówność Czebyszewa mówi, że w tej sytuacji wiemy o tym przynajmniej 75% danych to dwa standardowe odchylenia od średniej. Jak widzimy w tym przypadku, może to być znacznie więcej niż 75%.
Wartość nierówności polega na tym, że daje nam scenariusz „gorszego przypadku”, w którym jedyne rzeczy, które wiemy o naszych przykładowych danych (lub rozkład prawdopodobieństwa), to średnia i odchylenie standardowe. Gdy nie wiemy nic więcej o naszych danych, nierówność Czebyszewa zapewnia dodatkowy wgląd w to, jak rozłożony jest zestaw danych.
Historia nierówności
Nierówność została nazwana na cześć rosyjskiego matematyka Pafnuty Czebyszewa, który po raz pierwszy stwierdził nierówność bez dowodu w 1874 r. Dziesięć lat później nierówność została udowodniona przez Markowa w jego Ph. D. rozprawa. Ze względu na różnice w sposobie reprezentowania rosyjskiego alfabetu w języku angielskim Czebiszew jest także zapisany jako Czeczeszew.