W Statystyka, istnieje wiele terminów, które mają subtelne różnice między nimi. Jednym z przykładów jest różnica między częstotliwość i częstotliwość względna. Chociaż istnieje wiele zastosowań częstotliwości względnych, w szczególności jedno dotyczy histogramu częstotliwości względnej. Jest to rodzaj wykresu, który ma powiązania z innymi tematami w statystyce i statystyce matematycznej.
Definicja
Histogramy to wykresy statystyczne, które wyglądają wykresy słupkowe. Zazwyczaj jednak termin histogram jest zarezerwowany dla ilościowy zmienne. Oś pozioma histogramu zawiera linię liczbową zajęcia lub pojemniki o jednakowej długości. Te przedziały są interwałami linii liczbowej, w której dane mogą spaść i mogą składać się z jednej liczby (zazwyczaj dla oddzielny zestawy danych, które są stosunkowo małe) lub zakres wartości (dla większych zestawów danych dyskretnych i ciągły dane).
Na przykład, możemy być zainteresowani rozważeniem podziału wyników w quizie 50 punktów dla klasy uczniów. Jednym z możliwych sposobów zbudowania pojemników byłoby posiadanie innego pojemnika na każde 10 punktów.
Oś pionowa histogramu reprezentuje liczbę lub częstotliwość występowania wartości danych w każdym z pojemników. Im wyższy pasek, tym więcej wartości danych mieści się w tym zakresie wartości bin. Wracając do naszego przykładu, jeśli mamy pięciu uczniów, którzy uzyskali więcej niż 40 punktów w quizie, wówczas pasek odpowiadający przedziałowi od 40 do 50 będzie miał wysokość pięciu jednostek.
Porównanie histogramu częstotliwości
Histogram częstotliwości względnej jest niewielką modyfikacją typowego histogramu częstotliwości. Zamiast używać osi pionowej do zliczania wartości danych, które mieszczą się w danym przedziale, używamy tej osi do reprezentowania ogólnej proporcji wartości danych, które wpadają do tego przedziału. Ponieważ 100% = 1, wszystkie słupki muszą mieć wysokość od 0 do 1. Ponadto wysokości wszystkich słupków w naszym histogramie częstotliwości względnej muszą sumować się do 1.
Dlatego w bieżącym przykładzie, na który patrzyliśmy, załóżmy, że w naszej klasie jest 25 uczniów, a pięciu uzyskało ponad 40 punktów. Zamiast konstruować pręt o wysokości pięciu dla tego kosza, mielibyśmy pręt o wysokości 5/25 = 0,2.
Porównując histogram do histogramu częstotliwości względnej, każdy z tymi samymi przedziałami, coś zauważymy. Ogólny kształt histogramów będzie identyczny. Histogram częstotliwości względnej nie podkreśla ogólnej liczby w każdym przedziale. Zamiast tego ten typ wykresu koncentruje się na tym, jak liczba wartości danych w pojemniku odnosi się do innych pojemników. Przedstawia tę zależność w procentach całkowitej liczby wartości danych.
Funkcje prawdopodobieństwa masy
Możemy się zastanawiać, o co chodzi w definiowaniu histogramu częstotliwości względnej. Jedna kluczowa aplikacja dotyczy dyskretnych zmiennych losowych, w których nasze przedziały mają szerokość jeden i są wyśrodkowane wokół każdej nieujemnej liczby całkowitej. W tym przypadku możemy zdefiniować funkcję kawałkową z wartościami odpowiadającymi wysokościom pionowym słupków na naszym histogramie częstotliwości względnej.
Ten typ funkcji nazywany jest funkcją masy prawdopodobieństwa. Powodem konstruowania funkcji w ten sposób jest to, że krzywa zdefiniowana przez funkcję ma bezpośrednie połączenie prawdopodobieństwo. Obszar pod krzywą od wartości za do b to prawdopodobieństwo, że zmienna losowa ma wartość za do b.
Związek między prawdopodobieństwem a obszarem pod krzywą jest tym, który pojawia się wielokrotnie w statystyce matematycznej. Kolejnym takim połączeniem jest użycie funkcji masy prawdopodobieństwa do modelowania histogramu częstotliwości względnej.