Jak obliczyć medianę rozkładu wykładniczego

The mediana zbioru danych jest punktem środkowym, w którym dokładnie połowa wartości danych jest mniejsza lub równa medianie. W podobny sposób możemy pomyśleć o medianie ciągłyrozkład prawdopodobieństwa, ale zamiast znajdować środkową wartość w zbiorze danych, środek rozkładu znajdujemy w inny sposób.

Całkowity obszar pod funkcją gęstości prawdopodobieństwa wynosi 1, co stanowi 100%, w rezultacie połowa z tego może być reprezentowana przez połowę lub 50 procent. Jedną z wielkich idei statystyki matematycznej jest to, że prawdopodobieństwo jest reprezentowane przez obszar pod krzywą funkcja gęstości, która jest obliczana przez całkę, a zatem mediana rozkładu ciągłego jest punktem prawdziwy numer linia, w której dokładnie połowa obszaru leży po lewej stronie.

Można to bardziej zwięźle stwierdzić za pomocą następującej niewłaściwej całki. Mediana ciągłej zmiennej losowej X z funkcją gęstości fa( x) to wartość M taka, że:

0.5=mfa(x)rex0,5 = \ int_ {m.} ^ {- \ infty} f (x) dx0.5=mfa(x)rex

instagram viewer

Mediana dla rozkładu wykładniczego

Teraz obliczamy medianę dla rozkładu wykładniczego Exp (A). Zmienna losowa z tym rozkładem ma funkcję gęstości fa(x) = mi-x/ZA/ A dla x dowolna nieujemna liczba rzeczywista. Funkcja zawiera również stała matematyczna mi, w przybliżeniu równa 2,71828.

Ponieważ funkcja gęstości prawdopodobieństwa wynosi zero dla dowolnej wartości ujemnej wynoszącej x, wszystko, co musimy zrobić, to zintegrować poniższe i rozwiązać dla M:

0,5 = ∫0 M f (x) dx

Ponieważ całka ∫ mi-x/ZA/ A dx = -mi-x/ZAwynik jest taki

0,5 = -e-M / A + 1

Oznacza to, że 0,5 = mi-MAMA a po przyjęciu logarytmu naturalnego z obu stron równania otrzymujemy:

ln (1/2) = -M / A

Ponieważ 1/2 = 2-1, według właściwości logarytmów piszemy:

- ln2 = -M / A

Pomnożenie obu stron przez A daje nam wynik, że mediana M = A ln2.

Mediana-średnia nierówność w statystyce

Należy wymienić jedną konsekwencję tego wyniku: średnia rozkładu wykładniczego Exp (A) wynosi A, a ponieważ ln2 jest mniejsze niż 1, wynika z tego, że iloczyn Aln2 jest mniejszy niż A. Oznacza to, że mediana rozkładu wykładniczego jest mniejsza niż średnia.

Ma to sens, jeśli pomyślimy o wykresie funkcji gęstości prawdopodobieństwa. Ze względu na długi ogon ten rozkład jest przekrzywiony w prawo. Wiele razy, gdy rozkład jest przekrzywiony w prawo, średnia jest po prawej stronie mediany.

Oznacza to, że pod względem analizy statystycznej często możemy przewidzieć, że średnia i mediana nie są bezpośrednio skorelować, biorąc pod uwagę prawdopodobieństwo, że dane są przekrzywione w prawo, co można wyrazić jako średnią mediany dowodu nierówności znany jako Nierówność Czebyszewa.

Jako przykład weźmy zestaw danych, który zakłada, że ​​dana osoba otrzymuje w sumie 30 osób w ciągu 10 godzin, przy czym średni czas oczekiwania na odwiedzającego wynosi 20 minut, podczas gdy zestaw danych może przedstawiać, że mediana czasu oczekiwania wyniósłaby między 20 a 30 minut, gdyby ponad połowa z tych osób przybyła w pierwszych pięciu godziny.