Jest wiele rozkłady prawdopodobieństwa które są używane w statystykach. Na przykład standardowy rozkład normalny lub krzywa dzwonowa, jest prawdopodobnie najbardziej rozpoznawalnym. Normalne rozkłady są tylko jednym rodzajem rozkładu. Jeden bardzo przydatny rozkład prawdopodobieństwa do badania wariancji populacji nazywa się rozkładem F. Przeanalizujemy kilka właściwości tego rodzaju dystrybucji.
Podstawowe właściwości
Wzór gęstości prawdopodobieństwa dla rozkładu F. jest dość skomplikowany. W praktyce nie musimy przejmować się tą formułą. Pomocne może być jednak zapoznanie się z niektórymi szczegółami właściwości dotyczących rozkładu F. Kilka ważniejszych funkcji tej dystrybucji jest wymienionych poniżej:
- Rozkład F to rodzina rozkładów. Oznacza to, że istnieje nieskończona liczba różnych rozkładów F. Konkretna dystrybucja F, której używamy do aplikacji, zależy od liczby stopnie swobody które ma nasza próbka. Ta funkcja rozkładu F jest podobna do obu t-dystrybucja i rozkład chi-kwadrat.
- Rozkład F jest zerowy lub dodatni, więc nie ma wartości ujemnych dla fa. Ta funkcja rozkładu F jest podobna do rozkładu chi-kwadrat.
- Rozkład F wynosi wypaczony w prawo. Zatem ten rozkład prawdopodobieństwa jest niesymetryczny. Ta funkcja rozkładu F jest podobna do rozkładu chi-kwadrat.
Są to niektóre z ważniejszych i łatwych do zidentyfikowania funkcji. Przyjrzymy się bliżej stopniom swobody.
Stopnie swobody
Jedną z cech wspólnych dla rozkładów chi-kwadrat, rozkładów T i rozkładów F jest to, że naprawdę istnieje nieskończona rodzina każdej z tych rozkładów. Konkretny rozkład wyróżnia się poprzez znajomość liczby stopni swobody. Dla t rozkład, liczba stopni swobody jest o jeden mniejsza niż nasza próbka. Liczbę stopni swobody dla rozkładu F określa się w inny sposób niż dla rozkładu t lub nawet rozkładu chi-kwadrat.
Zobaczymy poniżej dokładnie, jak powstaje rozkład F. Na razie rozważymy tylko tyle, aby określić liczbę stopni swobody. Rozkład F pochodzi ze stosunku obejmującego dwie populacje. Jest próbka z każdej z tych populacji, a zatem istnieją stopnie swobody dla obu tych próbek. W rzeczywistości odejmujemy jeden z obu rozmiarów próbek, aby określić nasze dwie liczby stopni swobody.
Statystyki z tych populacji łączą się w ułamku dla statystyki F. Zarówno licznik, jak i mianownik mają stopnie swobody. Zamiast łączyć te dwie liczby w inną liczbę, zachowujemy obie z nich. Dlatego każde użycie tabeli rozkładu F wymaga od nas spojrzenia na dwa różne stopnie swobody.
Zastosowania rozkładu F.
Rozkład F wynika z wnioskowanie statystyczne dotyczące różnic w populacji. Mówiąc dokładniej, używamy rozkładu F, gdy badamy stosunek wariancji dwóch normalnie rozmieszczonych populacji.
Rozkład F nie służy wyłącznie do konstruowania przedziałów ufności i testowania hipotez dotyczących różnic populacji. Ten rodzaj dystrybucji jest również stosowany w jednym czynniku analiza wariancji (ANOVA). ANOVA zajmuje się porównywaniem wariancji między kilkoma grupami i zmianami w obrębie każdej grupy. Aby to osiągnąć, wykorzystujemy współczynnik wariancji. Ten stosunek wariancji ma rozkład F. Nieco skomplikowana formuła pozwala nam obliczyć statystykę F jako statystykę testową.