Podstawowe funkcje, które musimy mieć, to w sumie n prowadzone są niezależne próby i chcemy ustalić prawdopodobieństwo r sukcesy, w których każdy sukces ma prawdopodobieństwo p wystąpienia. W tym krótkim opisie podano i sugerowano kilka rzeczy. Definicja sprowadza się do tych czterech warunków:
Badany proces musi mieć jasno określoną liczbę prób, które się nie różnią. Nie możemy zmienić tej liczby w połowie naszej analizy. Każda próba musi być wykonana w taki sam sposób jak wszystkie inne, chociaż wyniki mogą się różnić. Liczba prób jest oznaczona przez n we wzorze.
Przykładem ustalonych prób dla procesu może być badanie wyników dziesięciokrotnego rzutu kostką. Tutaj każdy rzut kości jest próbą. Łączna liczba przeprowadzonych prób jest określana od samego początku.
Każda z prób musi być niezależna. Każda próba nie powinna mieć absolutnie żadnego wpływu na pozostałe. Klasyczne przykłady walcowania dwie kostki lub przerzucenie kilku monet ilustruje niezależne wydarzenia. Ponieważ wydarzenia są niezależne, możemy korzystać z reguła mnożenia pomnożyć prawdopodobieństwa razem.
W praktyce, szczególnie ze względu na niektóre techniki pobierania próbek, mogą wystąpić sytuacje, w których próby nie są technicznie niezależne. ZA rozkład dwumianowy może być czasem stosowany w takich sytuacjach, o ile populacja jest większa w stosunku do próby.
Każda z prób jest podzielona na dwie kategorie: sukcesy i porażki. Chociaż zazwyczaj myślimy o sukcesie jako o pozytywnej rzeczy, nie powinniśmy zbytnio czytać tego terminu. Wskazujemy, że próba zakończyła się sukcesem, ponieważ zgadza się z tym, co postanowiliśmy nazwać sukcesem.
Jako ekstremalny przypadek ilustrujący to załóżmy, że testujemy wskaźnik awaryjności żarówek. Jeśli chcemy wiedzieć, ile z partii nie zadziała, moglibyśmy określić sukces naszej próby, gdy mamy żarówkę, która nie działa. Niepowodzenie próby polega na tym, że żarówka działa. Może to zabrzmieć nieco wstecz, ale mogą istnieć dobre powody, aby zdefiniować sukcesy i porażki naszej próby, tak jak to zrobiliśmy. Do celów znakowania może być wskazane podkreślenie, że istnieje małe prawdopodobieństwo, że żarówka nie będzie działać, niż wysokie prawdopodobieństwo, że żarówka będzie działać.
Prawdopodobieństwa udanych prób muszą pozostać takie same przez cały badany przez nas proces. Rzut monetą jest tego przykładem. Bez względu na to, ile monet zostanie wyrzuconych, za każdym razem prawdopodobieństwo przewrócenia głowy wynosi 1/2.
To kolejne miejsce, w którym teoria i praktyka są nieco inne. Pobieranie próbek bez wymiany może powodować nieznaczne wahania prawdopodobieństwa każdej próby. Załóżmy, że na 1000 psów jest 20 beagle. Prawdopodobieństwo losowego wybrania beagle to 20/1000 = 0,020. Teraz wybierz ponownie spośród pozostałych psów. Na 999 psów jest 19 psów rasy beagle. Prawdopodobieństwo wyboru innego beagle to 19/999 = 0,019. The wartość 0,2 jest odpowiednim oszacowaniem dla obu tych prób. O ile populacja jest wystarczająco duża, tego rodzaju oszacowania nie stanowią problemu przy stosowaniu rozkładu dwumianowego.