W statystykach stopnie swobody służą do określania liczby niezależnych wielkości, które można przypisać do rozkładu statystycznego. Liczba ta zazwyczaj odnosi się do dodatniej liczby całkowitej, która wskazuje na brak ograniczeń w zdolności osoby do obliczania brakujących czynników na podstawie problemów statystycznych.
Stopnie swobody działają jako zmienne w końcowym obliczeniu statystyki i służą do określania wyniku różnych scenariusze w systemie oraz w matematyce stopnie swobody określają liczbę wymiarów w domenie potrzebną do określenia pełny wektor.
Aby zilustrować koncepcję stopnia swobody, przyjrzymy się podstawowym obliczeniom dotyczącym próbki oznacza, i aby znaleźć średnią z listy danych, dodajemy wszystkie dane i dzielimy przez całkowitą liczbę wartości.
Ilustracja ze średnią próbką
Przez chwilę przypuśćmy, że wiemy oznaczać zbioru danych to 25, a wartości w tym zestawie to 20, 10, 50 i jedna nieznana liczba. Wzór na średnią próbną daje nam równanie (20 + 10 + 50 + x) / 4 = 25, gdzie
x oznacza nieznane, używając podstawowych algebra, można następnie ustalić, że brakująca liczba, xjest równa 20.Zmieńmy nieco ten scenariusz. Ponownie zakładamy, że wiemy, że średnia zestawu danych wynosi 25. Jednak tym razem wartości w zestawie danych wynoszą 20, 10 i dwie nieznane wartości. Te niewiadome mogą być różne, więc używamy dwóch różne zmienne, x, i y oznaczać to. Wynikowe równanie to (20 + 10 + x + y) / 4 = 25. Z pewną algebrą otrzymujemy y = 70- x. Formuła została napisana w tym formularzu, aby pokazać, że po wybraniu wartości x, wartość dla y jest całkowicie zdeterminowany. Mamy jeden wybór, a to pokazuje, że jest jeden stopień wolności.
Teraz przyjrzymy się wielkości próbki wynoszącej sto. Jeśli wiemy, że średnia z tych przykładowych danych wynosi 20, ale nie znamy wartości żadnej z danych, oznacza to, że istnieje 99 stopni swobody. Wszystkie wartości muszą się sumować łącznie 20 x 100 = 2000. Kiedy już mamy wartości 99 elementów w zbiorze danych, to ustalany jest ostatni.
Wynik t studenta i rozkład chi-kwadrat
Stopnie swobody odgrywają ważną rolę podczas korzystania z Student tTabela wyników. W rzeczywistości jest ich kilka t-score dystrybucje. Rozróżniamy te rozkłady za pomocą stopni swobody.
Tutaj rozkład prawdopodobieństwa to, którego używamy, zależy od wielkości naszej próbki. Jeśli nasz rozmiar próby to n, wówczas liczba stopni swobody wynosi n-1. Na przykład rozmiar próbki 22 wymagałby od nas użycia wiersza t- tabela wyników z 21 stopniami swobody.
Zastosowanie rozkład chi-kwadrat wymaga również użycia stopnie swobody. Tutaj, w identyczny sposób jak w przypadku t-score dystrybucja, wielkość próbki określa, której dystrybucji należy użyć. Jeśli wielkość próbki to n, to są n-1 stopnie swobody.
Odchylenie standardowe i zaawansowane techniki
Innym miejscem, w którym pojawiają się stopnie swobody, jest wzór na odchylenie standardowe. To zjawisko nie jest tak jawne, ale możemy to zobaczyć, jeśli wiemy, gdzie szukać. Do znajdź odchylenie standardowe szukamy „przeciętnego” odchylenia od średniej. Jednak po odjęciu średniej od każdej wartości danych i wyprostowaniu różnic, dzielimy przez n-1 zamiast n jak możemy się spodziewać.
Obecność n-1 pochodzi z liczby stopni swobody. Od czasu n istnieją wartości danych i średnia próbki we wzorze, istnieją n-1 stopnie swobody.
Bardziej zaawansowane techniki statystyczne wykorzystują bardziej skomplikowane sposoby liczenia stopni swobody. Przy obliczaniu statystyki testu dla dwóch średnich z niezależnymi próbkami n1 i n2 elementów, liczba stopni swobody ma dość skomplikowaną formułę. Można to oszacować za pomocą mniejszego z n1-1 i n2-1
Kolejny przykład innego sposobu liczenia stopni swobody pochodzi z fa test. W prowadzeniu fa test mamy k próbki każdej wielkości n—Stopień swobody w liczniku wynosi k-1, a w mianowniku jest k(n-1).