Rozkład prawdopodobieństwa w statystyce

Jeśli w ogóle spędzasz dużo czasu Statystyka, bardzo szybko natrafisz na wyrażenie „rozkład prawdopodobieństwa”. To tutaj naprawdę możemy zobaczyć, jak bardzo obszary prawdopodobieństwa i statystyki pokrywają się. Chociaż może to zabrzmieć jak coś technicznego, rozkład prawdopodobieństwa frazy jest tak naprawdę tylko sposobem na rozmowę o zorganizowaniu listy prawdopodobieństw. Rozkład prawdopodobieństwa jest funkcją lub regułą, która przypisuje prawdopodobieństwa każdej wartości zmiennej losowej. Rozkład może w niektórych przypadkach zostać wymieniony. W innych przypadkach jest przedstawiany jako wykres.

Przykład

Załóżmy, że my Rzuć dwie kostki a następnie zapisz sumę kości. Możliwe są sumy od dwóch do 12. Każda suma ma określone prawdopodobieństwo wystąpienia. Możemy po prostu wymienić je w następujący sposób:

  • Suma 2 ma prawdopodobieństwo 1/36
  • Suma 3 ma prawdopodobieństwo 2/36
  • Suma 4 ma prawdopodobieństwo 3/36
  • Suma 5 ma prawdopodobieństwo 4/36
  • Suma 6 ma prawdopodobieństwo 5/36
  • Suma 7 ma prawdopodobieństwo 6/36
  • instagram viewer
  • Suma 8 ma prawdopodobieństwo 5/36
  • Suma 9 ma prawdopodobieństwo 4/36
  • Suma 10 ma prawdopodobieństwo 3/36
  • Suma 11 ma prawdopodobieństwo 2/36
  • Suma 12 ma prawdopodobieństwo 1/36

Ta lista jest rozkładem prawdopodobieństwa dla eksperymentu prawdopodobieństwa wyrzucenia dwóch kości. Możemy również rozważyć powyższe jako rozkład prawdopodobieństwa zmienna losowa zdefiniowane przez spojrzenie na sumę dwóch kości.

Wykres

Rozkład prawdopodobieństwa może być wykreślony, a czasem pomaga to pokazać cechy rozkładu, które nie były oczywiste po przeczytaniu listy prawdopodobieństw. Zmienna losowa jest wykreślana wzdłuż x-osi, a odpowiadające jej prawdopodobieństwo wykreślono wzdłuż y-oś. Dla dyskretnej zmiennej losowej będziemy mieć histogram. W przypadku ciągłej zmiennej losowej będziemy mieć wnętrze gładkiej krzywej.

Reguły prawdopodobieństwa nadal obowiązują i manifestują się na kilka sposobów. Ponieważ prawdopodobieństwa są większe lub równe zero, wykres rozkładu prawdopodobieństwa musi mieć y-koordynacje, które są nieujemne. Inna cecha prawdopodobieństwa, a mianowicie to, że jest to maksimum prawdopodobieństwa zdarzenia, pokazuje się w inny sposób.

Obszar = prawdopodobieństwo

Wykres rozkładu prawdopodobieństwa jest skonstruowany w taki sposób, że obszary reprezentują prawdopodobieństwa. Aby uzyskać dyskretny rozkład prawdopodobieństwa, tak naprawdę obliczamy tylko obszary prostokątów. Na powyższym wykresie obszary trzech słupków odpowiadające czterem, piątym i szóstemu odpowiadają prawdopodobieństwu, że suma naszych kości wynosi cztery, pięć lub sześć. Obszary wszystkich pasków stanowią łącznie jeden.

w standardowy rozkład normalny lub krzywa dzwonowa, mamy podobną sytuację. Obszar pod krzywą między dwoma z wartości odpowiadają prawdopodobieństwu, że nasza zmienna mieści się między tymi dwiema wartościami. Na przykład obszar pod krzywą dzwonową dla -1 z.

Ważne dystrybucje

Są dosłownie nieskończone wiele rozkładów prawdopodobieństwa. Oto lista niektórych ważniejszych dystrybucji:

  • Rozkład dwumianowy - Podaje liczbę sukcesów serii niezależnych eksperymentów z dwoma wynikami
  • Rozkład chi-kwadrat - Do zastosowania przy określaniu, jak blisko obserwowane wielkości pasują do proponowanego modelu
  • Rozkład F. - Używany w analiza wariancji (ANOVA)
  • Normalna dystrybucja - nazywany krzywa dzwonowa i znajduje się w statystykach.
  • Rozkład t studenta - Do użytku z małymi próbkami o normalnym rozkładzie