Zmienne losowe o rozkładzie dwumianowym wiadomo, że są dyskretne. Oznacza to, że istnieje policzalna liczba wyników, które mogą wystąpić w rozkładzie dwumianowym, z oddzieleniem tych wyników. Na przykład zmienna dwumianowa może przyjmować wartość trzy lub cztery, ale nie liczbę między trzema a czterema.
Przy dyskretnym charakterze rozkładu dwumianowego dość zaskakujące jest to, że ciągłą zmienną losową można zastosować do przybliżenia rozkładu dwumianowego. Dla wielu rozkłady dwumianowe, możemy użyć rozkładu normalnego do przybliżenia naszych prawdopodobieństw dwumianowych.
Można to zobaczyć, patrząc na n podrzucanie monet i wynajem X być liczbą głów. W tej sytuacji mamy rozkład dwumianowy z prawdopodobieństwem sukcesu as p = 0,5 Gdy zwiększamy liczbę rzutów, widzimy to prawdopodobieństwo histogram jest coraz bardziej podobny do rozkładu normalnego.
Oświadczenie o normalnym zbliżeniu
Każdy rozkład normalny jest całkowicie zdefiniowany przez dwa liczby rzeczywiste. Liczby te są średnią, która mierzy środek rozkładu i
odchylenie standardowe, który mierzy rozprzestrzenianie się rozkładu. Dla danej sytuacji dwumianowej musimy być w stanie określić, którego rozkładu normalnego użyć.Wybór prawidłowego rozkładu normalnego zależy od liczby prób n w ustawieniach dwumianowych i stałym prawdopodobieństwie sukcesu p dla każdej z tych prób. Normalne przybliżenie naszej zmiennej dwumianowej jest średnią z np i standardowe odchylenie (np(1 - p)0.5.
Załóżmy na przykład, że zgadliśmy na każde ze 100 pytań testu wielokrotnego wyboru, gdzie każde pytanie miało jedną poprawną odpowiedź z czterech opcji. Liczba poprawnych odpowiedzi X jest dwumianową zmienną losową z n = 100 i p = 0.25. Zatem ta zmienna losowa ma średnią 100 (0,25) = 25 i odchylenie standardowe (100 (0,25) (0,75))0.5 = 4.33. Rozkład normalny ze średnią 25 i odchylenie standardowe 4,33 będą działać w celu przybliżenia tego rozkładu dwumianowego.
Kiedy zbliżenie jest właściwe?
Używając pewnej matematyki można wykazać, że istnieje kilka warunków, które musimy zastosować normalne przybliżenie do rozkład dwumianowy. Liczba obserwacji n musi być wystarczająco duży, a wartość p tak że oba np i n(1 - p) są większe lub równe 10. Jest to ogólna zasada, którą kieruje praktyka statystyczna. Zawsze można zastosować normalne przybliżenie, ale jeśli te warunki nie są spełnione, przybliżenie może nie być tak dobre z przybliżenia.
Na przykład jeśli n = 100 i p = 0,25, wówczas uzasadnione jest stosowanie normalnego przybliżenia. To dlatego, że np = 25 i n(1 - p) = 75. Ponieważ obie te liczby są większe niż 10, odpowiedni rozkład normalny wykona całkiem dobrą robotę oszacowania prawdopodobieństw dwumianowych.
Dlaczego warto korzystać z aproksymacji?
Prawdopodobieństwa dwumianowe są obliczane przy użyciu bardzo prostej formuły w celu znalezienia współczynnika dwumianowego. Niestety z powodu silnie we wzorze łatwo jest napotkać trudności obliczeniowe związane z dwumianowy formuła. Normalne przybliżenie pozwala nam ominąć każdy z tych problemów, pracując ze znajomym znajomym, tabelą wartości standardowego rozkładu normalnego.
Wielokrotne ustalenie prawdopodobieństwa, że dwumianowa zmienna losowa mieści się w zakresie wartości, jest żmudne do obliczenia. Jest tak, ponieważ aby znaleźć prawdopodobieństwo, że zmienna dwumianowa X jest większa niż 3 i mniejsza niż 10, musielibyśmy znaleźć prawdopodobieństwo, że X równa się 4, 5, 6, 7, 8 i 9, a następnie sumuje wszystkie te prawdopodobieństwa razem. Jeśli można zastosować normalne przybliżenie, zamiast tego będziemy musieli określić wyniki Z odpowiadające 3 i 10, a następnie użyć tabeli prawdopodobieństw Z dla standardowy rozkład normalny.