Termin krzywa dzwonowa służy do opisania pojęcia matematycznego zwanego rozkładem normalnym, czasami określanym jako rozkład Gaussa. „Krzywa dzwonu” odnosi się do kształtu dzwonu, który jest tworzony, gdy linia jest wykreślana przy użyciu punktów danych dla elementu, który spełnia kryteria rozkładu normalnego.
Na krzywej dzwonowej środek zawiera największą liczbę wartości, a zatem jest najwyższym punktem na łuku linii. Ten punkt odnosi się do oznaczać, ale najprościej mówiąc, jest to najwyższa liczba wystąpień elementu (pod względem statystycznym tryb).
Normalna dystrybucja
Ważna rzecz do zapamiętania na temat normalna dystrybucja jest to, że krzywa jest skoncentrowana w środku i maleje po obu stronach. Jest to istotne, ponieważ dane mają mniejszą tendencję do generowania niezwykle ekstremalnych wartości, zwanych wartościami odstającymi, w porównaniu do innych rozkładów. Krzywa dzwonowa oznacza również, że dane są symetryczne. Oznacza to, że możesz stworzyć uzasadnione oczekiwania co do możliwości, że wynik będzie leżał w granicach zakres po lewej lub prawej stronie środka, po zmierzeniu wielkości odchylenia zawartego w danych. Jest to mierzone w kategoriach
odchylenia standardowe.Wykres krzywej dzwonowej zależy od dwóch czynników: średniej i odchylenia standardowego. Średnia określa pozycję środka, a odchylenie standardowe określa wysokość i szerokość dzwonu. Na przykład duże odchylenie standardowe tworzy dzwonek, który jest krótki i szeroki, a małe odchylenie standardowe tworzy wysoką i wąską krzywą.
Prawdopodobieństwo krzywej dzwonowej i odchylenie standardowe
Aby zrozumieć czynniki prawdopodobieństwa rozkładu normalnego, musisz zrozumieć następujące zasady:
- Całkowity obszar pod krzywą jest równy 1 (100%)
- Około 68% powierzchni pod krzywą mieści się w jednym odchyleniu standardowym.
- Około 95% powierzchni pod krzywą mieści się w dwóch standardowych odchyleniach.
- Około 99,7% powierzchni pod krzywą mieści się w trzech standardowych odchyleniach.
Punkty 2, 3 i 4 powyżej są czasami określane jako reguła empiryczna lub reguła 68–95–99,7. Po ustaleniu, że dane są zwykle dystrybuowane (dzwonek zakrzywiony) i obliczyć średnią i odchylenie standardowe, możesz określić prawdopodobieństwo że pojedynczy punkt danych będzie się mieścić w danym zakresie możliwości.
Przykład krzywej dzwonowej
Dobrym przykładem krzywej dzwonowej lub rozkładu normalnego jest rzut dwiema kośćmi. Rozkład jest wyśrodkowany wokół liczby siódmej, a prawdopodobieństwo maleje wraz z oddalaniem się od centrum.
Oto procent szansy na różne wyniki, gdy rzucisz dwiema kośćmi.
- Dwa: (1/36) 2.78%
- Trzy: (2/36) 5.56%
- Cztery: (3/36) 8.33%
- Pięć: (4/36) 11.11%
- Sześć: (5/36) 13.89%
- Siedem: (6/36) 16,67% = najbardziej prawdopodobny wynik
- Osiem: (5/36) 13.89%
- Dziewięć: (4/36) 11.11%
- Dziesięć: (3/36) 8.33%
- Jedenaście: (2/36) 5.56%
- Dwanaście: (1/36) 2.78%
Normalne rozkłady mają wiele dogodnych właściwości, więc w wielu przypadkach, szczególnie w fizyka i astronomia, często przyjmuje się, że losowe zmiany o nieznanych rozkładach są normalne, aby umożliwić obliczenia prawdopodobieństwa. Chociaż może to być niebezpieczne założenie, często jest to dobre przybliżenie ze względu na zaskakujący wynik znany jako centralne twierdzenie graniczne.
Twierdzenie to stwierdza, że średnia dowolnego zestawu wariantów o dowolnym rozkładzie o skończonej średniej i wariancji ma tendencję do występowania w rozkładzie normalnym. Wiele typowych atrybutów, takich jak wyniki testu lub wysokość, ma w przybliżeniu normalne rozkłady, z niewielką liczbą elementów na górze i dole, a wieloma pośrodku.
Kiedy nie powinieneś używać krzywej dzwonowej
Istnieje kilka rodzajów danych, które nie są zgodne z normalnym wzorcem dystrybucji. Te zestawy danych nie powinny być zmuszane do próby dopasowania krzywej dzwonowej. Klasycznym przykładem byłyby oceny uczniów, które często mają dwa tryby. Inne typy danych, które nie są zgodne z krzywą, obejmują dochód, wzrost populacji i awarie mechaniczne.