The mediana zbioru danych jest punktem środkowym, w którym dokładnie połowa wartości danych jest mniejsza lub równa medianie. W podobny sposób możemy pomyśleć o medianie ciągłyrozkład prawdopodobieństwa, ale zamiast znajdować środkową wartość w zbiorze danych, środek rozkładu znajdujemy w inny sposób.
Całkowity obszar pod funkcją gęstości prawdopodobieństwa wynosi 1, co stanowi 100%, w rezultacie połowa z tego może być reprezentowana przez połowę lub 50 procent. Jedną z wielkich idei statystyki matematycznej jest to, że prawdopodobieństwo jest reprezentowane przez obszar pod krzywą funkcja gęstości, która jest obliczana przez całkę, a zatem mediana rozkładu ciągłego jest punktem prawdziwy numer linia, w której dokładnie połowa obszaru leży po lewej stronie.
Można to bardziej zwięźle stwierdzić za pomocą następującej niewłaściwej całki. Mediana ciągłej zmiennej losowej X z funkcją gęstości fa( x) to wartość M taka, że:
0.5=∫m−∞fa(x)rex
Mediana dla rozkładu wykładniczego
Teraz obliczamy medianę dla rozkładu wykładniczego Exp (A). Zmienna losowa z tym rozkładem ma funkcję gęstości fa(x) = mi-x/ZA/ A dla x dowolna nieujemna liczba rzeczywista. Funkcja zawiera również stała matematyczna mi, w przybliżeniu równa 2,71828.
Ponieważ funkcja gęstości prawdopodobieństwa wynosi zero dla dowolnej wartości ujemnej wynoszącej x, wszystko, co musimy zrobić, to zintegrować poniższe i rozwiązać dla M:
0,5 = ∫0 M f (x) dx
Ponieważ całka ∫ mi-x/ZA/ A dx = -mi-x/ZAwynik jest taki
0,5 = -e-M / A + 1
Oznacza to, że 0,5 = mi-MAMA a po przyjęciu logarytmu naturalnego z obu stron równania otrzymujemy:
ln (1/2) = -M / A
Ponieważ 1/2 = 2-1, według właściwości logarytmów piszemy:
- ln2 = -M / A
Pomnożenie obu stron przez A daje nam wynik, że mediana M = A ln2.
Mediana-średnia nierówność w statystyce
Należy wymienić jedną konsekwencję tego wyniku: średnia rozkładu wykładniczego Exp (A) wynosi A, a ponieważ ln2 jest mniejsze niż 1, wynika z tego, że iloczyn Aln2 jest mniejszy niż A. Oznacza to, że mediana rozkładu wykładniczego jest mniejsza niż średnia.
Ma to sens, jeśli pomyślimy o wykresie funkcji gęstości prawdopodobieństwa. Ze względu na długi ogon ten rozkład jest przekrzywiony w prawo. Wiele razy, gdy rozkład jest przekrzywiony w prawo, średnia jest po prawej stronie mediany.
Oznacza to, że pod względem analizy statystycznej często możemy przewidzieć, że średnia i mediana nie są bezpośrednio skorelować, biorąc pod uwagę prawdopodobieństwo, że dane są przekrzywione w prawo, co można wyrazić jako średnią mediany dowodu nierówności znany jako Nierówność Czebyszewa.
Jako przykład weźmy zestaw danych, który zakłada, że dana osoba otrzymuje w sumie 30 osób w ciągu 10 godzin, przy czym średni czas oczekiwania na odwiedzającego wynosi 20 minut, podczas gdy zestaw danych może przedstawiać, że mediana czasu oczekiwania wyniósłaby między 20 a 30 minut, gdyby ponad połowa z tych osób przybyła w pierwszych pięciu godziny.