Kiedy odchylenie standardowe jest równe zeru

The Odchylenie standardowe próbki to statystyka opisowa, która mierzy rozprzestrzenianie się zbioru danych ilościowych. Liczba ta może być dowolną nieujemną liczbą rzeczywistą. Ponieważ zero jest nieujemne prawdziwy numer, warto zapytać: „Kiedy odchylenie standardowe próbki będzie równe zero?” Dzieje się tak w wyjątkowym i bardzo nietypowym przypadku, gdy wszystkie nasze wartości danych są dokładnie takie same. Zbadamy przyczyny tego.

Opis odchylenia standardowego

Dwa ważne pytania, na które zazwyczaj chcemy odpowiedzieć na temat zestawu danych, obejmują:

  • Jakie jest centrum zestawu danych?
  • Jak rozłożony jest zestaw danych?

Istnieją różne pomiary, zwane statystykami opisowymi, które odpowiadają na te pytania. Na przykład centrum danych, znane również jako średni, można opisać w kategoriach średniej, mediany lub trybu. Można użyć innych mniej znanych statystyk, takich jak midhinge lub trimean.

Do rozprzestrzeniania naszych danych moglibyśmy użyć zakresu, zakres międzykwartylowy lub odchylenie standardowe. Odchylenie standardowe jest zestawiane ze średnią do oceny ilościowej rozprzestrzeniania się naszych danych. Następnie możemy użyć tego numeru do porównania wielu zestawów danych. Im większe jest nasze odchylenie standardowe, tym większy jest spread.

instagram viewer

Intuicja

Rozważmy więc z tego opisu, co oznaczałoby odchylenie standardowe równe zero. Oznaczałoby to, że w naszym zbiorze danych w ogóle nie ma spreadu. Wszystkie poszczególne wartości danych zostałyby zebrane razem w jedną wartość. Ponieważ nasze dane mogłyby mieć tylko jedną wartość, wartość ta stanowiłaby średnią z naszej próby.

W tej sytuacji, gdy wszystkie nasze wartości danych są takie same, nie byłoby żadnych zmian. Intuicyjnie ma sens, że odchylenie standardowe takiego zestawu danych wynosi zero.

Dowód matematyczny

Przykładowe odchylenie standardowe jest określone wzorem. Tak więc każde stwierdzenie takie jak powyższe powinno zostać udowodnione przy użyciu tej formuły. Zaczynamy od zestawu danych, który pasuje do powyższego opisu: wszystkie wartości są identyczne i istnieją n wartości równe x.

Obliczamy średnią tego zestawu danych i widzimy, że tak jest

x = (x + x +... + x)/n = nx/n = x.

Teraz, gdy obliczamy indywidualne odchylenia od średniej, widzimy, że wszystkie te odchylenia są zerowe. W związku z tym zarówno wariancja, jak i odchylenie standardowe są równe zeru.

Niezbędne i wystarczające

Widzimy, że jeśli zestaw danych nie wykazuje zmian, wówczas jego odchylenie standardowe wynosi zero. Możemy zapytać, czy rozmawiać tego stwierdzenia jest również prawdziwe. Aby sprawdzić, czy tak jest, użyjemy ponownie wzoru na odchylenie standardowe. Tym razem jednak ustawimy odchylenie standardowe równe zero. Nie przyjmujemy żadnych założeń dotyczących naszego zestawu danych, ale zobaczymy, jakie ustawienie s = 0 implikuje

Załóżmy, że standardowe odchylenie zestawu danych jest równe zero. Oznaczałoby to, że wariancja próbki s2 jest również równe zero. Wynikiem jest równanie:

0 = (1/(n - 1)) ∑ (xja - x )2

Mnożymy obie strony równania przez n - 1 i zobacz, że suma kwadratowych odchyleń jest równa zero. Ponieważ pracujemy z liczbami rzeczywistymi, jedynym sposobem na to jest, aby każde z kwadratowych odchyleń było równe zero. Oznacza to, że dla każdego ja, termin (xja - x )2 = 0.

Teraz bierzemy pierwiastek kwadratowy powyższego równania i widzimy, że każde odchylenie od średniej musi być równe zero. Ponieważ dla wszystkich ja,

xja - x = 0

Oznacza to, że każda wartość danych jest równa średniej. Ten wynik wraz z powyższym pozwala nam powiedzieć, że przykładowe odchylenie standardowe zestawu danych wynosi zero wtedy i tylko wtedy, gdy wszystkie jego wartości są identyczne.