Jedno pytanie, które zawsze jest ważne Statystyka to: „Czy zaobserwowany wynik wynika wyłącznie z przypadku, czy jest nim statystycznie znaczące? Jedna klasa testy hipotez, zwane testami permutacji, pozwalają nam przetestować to pytanie. Przegląd i kroki takiego testu to:
- Podzieliliśmy naszych badanych na grupę kontrolną i eksperymentalną. Hipotezą zerową jest to, że nie ma różnicy między tymi dwiema grupami.
- Zastosuj leczenie w grupie eksperymentalnej.
- Zmierz odpowiedź na leczenie
- Rozważ każdą możliwą konfigurację grupy eksperymentalnej i obserwowaną odpowiedź.
- Oblicz wartość p na podstawie naszej zaobserwowanej odpowiedzi w odniesieniu do wszystkich potencjalnych grup eksperymentalnych.
To jest zarys permutacji. Dla uproszczenia tego szkicu poświęcimy czas na szczegółowe przeanalizowanie opracowanego przykładu takiego testu permutacji.
Przykład
Załóżmy, że badamy myszy. W szczególności interesuje nas, jak szybko myszy kończą labirynt, z którym nigdy wcześniej się nie spotkały. Chcemy przedstawić dowody na korzyść eksperymentalnego leczenia. Celem jest wykazanie, że myszy w grupie leczonej rozwiążą labirynt szybciej niż myszy nieleczone.
Zaczynamy od naszych badanych: sześć myszy. Dla wygody myszy będą oznaczane literami A, B, C, D, E, F. Trzy z tych myszy zostaną losowo wybrane do eksperymentalnego leczenia, a pozostałe trzy zostaną umieszczone w grupie kontrolnej, w której osobnicy otrzymują placebo.
Następnie losowo wybierzemy kolejność wybierania myszy do labiryntu. Zostanie odnotowany czas spędzony na ukończeniu labiryntu dla wszystkich myszy i zostanie obliczona średnia dla każdej grupy.
Załóżmy, że nasza losowa selekcja obejmuje myszy A, C i E w grupie eksperymentalnej, a inne myszy w placebo Grupa kontrolna. Po wdrożeniu leczenia losowo wybieramy kolejność, w której myszy biegną przez labirynt.
Czasy przebiegu dla każdej myszy są następujące:
- Mysz A uruchamia wyścig w 10 sekund
- Mysz B prowadzi wyścig w 12 sekund
- Mysz C prowadzi wyścig w 9 sekund
- Mysz D uruchamia wyścig w 11 sekund
- Mysz E prowadzi wyścig w 11 sekund
- Mysz F uruchamia wyścig w 13 sekund.
Średni czas ukończenia labiryntu myszy w grupie eksperymentalnej wynosi 10 sekund. Średni czas na ukończenie labiryntu w grupie kontrolnej wynosi 12 sekund.
Moglibyśmy zadać kilka pytań. Czy leczenie naprawdę jest przyczyną szybszego średniego czasu? A może mieliśmy po prostu szczęście w naszej grupie kontrolnej i eksperymentalnej? Leczenie mogło nie przynieść żadnego efektu i losowo wybraliśmy wolniejsze myszy do otrzymania placebo i szybsze myszy do otrzymania leczenia. Test permutacji pomoże odpowiedzieć na te pytania.
Hipotezy
Hipotezami dla naszego testu permutacji są:
- The Hipoteza zerowa jest stwierdzeniem braku efektu. W tym konkretnym teście mamy H0: Nie ma różnicy między grupami leczenia. Średni czas uruchomienia labiryntu dla wszystkich myszy bez leczenia jest taki sam jak średni czas dla wszystkich myszy poddanych leczeniu.
- Alternatywna hipoteza jest tym, na co staramy się ustalić dowody. W takim przypadku mielibyśmy Hza: Średni czas dla wszystkich myszy poddanych leczeniu będzie szybszy niż średni czas dla wszystkich myszy bez leczenia.
Permutacje
Jest sześć myszy i są trzy miejsca w grupie eksperymentalnej. Oznacza to, że liczba możliwych grup eksperymentalnych jest określona liczbą kombinacji C (6,3) = 6! / (3! 3!) = 20. Pozostałe osoby byłyby częścią grupy kontrolnej. Istnieje więc 20 różnych sposobów losowego wyboru osób z naszych dwóch grup.
Przypisanie A, C i E do grupy eksperymentalnej przeprowadzono losowo. Ponieważ istnieje 20 takich konfiguracji, konkretna konfiguracja z A, C i E w grupie eksperymentalnej ma prawdopodobieństwo 1/20 = 5% wystąpienia.
Musimy ustalić wszystkie 20 konfiguracji eksperymentalnej grupy osób w naszym badaniu.
- Grupa eksperymentalna: A B C i grupa kontrolna: D E F
- Grupa eksperymentalna: A B D i grupa kontrolna: C E F
- Grupa eksperymentalna: A B E i grupa kontrolna: C D F
- Grupa eksperymentalna: A B F i grupa kontrolna: C D E
- Grupa eksperymentalna: A C D i grupa kontrolna: B E F
- Grupa eksperymentalna: A C E i grupa kontrolna: B D F
- Grupa eksperymentalna: A C F i grupa kontrolna: B D E
- Grupa eksperymentalna: A D E i grupa kontrolna: B C F
- Grupa eksperymentalna: A D F i grupa kontrolna: B C E
- Grupa eksperymentalna: A E F i grupa kontrolna: B C D
- Grupa eksperymentalna: B C D i Grupa kontrolna: A E F
- Grupa eksperymentalna: B C E i grupa kontrolna: A D F
- Grupa eksperymentalna: B C F i Grupa kontrolna: A D E
- Grupa eksperymentalna: B D E i grupa kontrolna: A C F
- Grupa eksperymentalna: B D F i grupa kontrolna: A C E
- Grupa eksperymentalna: B E F i grupa kontrolna: A C D
- Grupa eksperymentalna: C D E i grupa kontrolna: A B F.
- Grupa eksperymentalna: C D F i grupa kontrolna: A B E
- Grupa eksperymentalna: C E F i grupa kontrolna: A B D
- Grupa eksperymentalna: D E F i grupa kontrolna: A B C
Następnie przyglądamy się każdej konfiguracji grup eksperymentalnych i kontrolnych. Obliczamy średnią dla każdej z 20 permutacji z powyższej listy. Na przykład dla pierwszego A, B i C mają czasy odpowiednio 10, 12 i 9. Średnia z tych trzech liczb wynosi 10,3333. Również w tej pierwszej permutacji D, E i F mają czasy odpowiednio 11, 11 i 13. Ma to średnio 11.6666.
Po obliczeniu średnia z każdej grupy, obliczamy różnicę między tymi średnimi. Każde z poniższych odpowiada różnicy między grupami eksperymentalną i kontrolną, które zostały wymienione powyżej.
- Placebo - leczenie = 1,333333333 sekundy
- Placebo - leczenie = 0 sekund
- Placebo - leczenie = 0 sekund
- Placebo - leczenie = -1.333333333 sekund
- Placebo - leczenie = 2 sekundy
- Placebo - leczenie = 2 sekundy
- Placebo - leczenie = 0,6666666667 sekund
- Placebo - leczenie = 0,6666666667 sekund
- Placebo - leczenie = -0,666666667 sekund
- Placebo - leczenie = -0,666666667 sekund
- Placebo - leczenie = 0,6666666667 sekund
- Placebo - leczenie = 0,6666666667 sekund
- Placebo - leczenie = -0,666666667 sekund
- Placebo - leczenie = -0,666666667 sekund
- Placebo - leczenie = -2 sekundy
- Placebo - leczenie = -2 sekundy
- Placebo - leczenie = 1,333333333 sekundy
- Placebo - leczenie = 0 sekund
- Placebo - leczenie = 0 sekund
- Placebo - leczenie = -1.333333333 sekund
Wartość p
Teraz oceniamy różnice między średnimi z każdej grupy, które zauważyliśmy powyżej. Tabelujemy również odsetek naszych 20 różnych konfiguracji, które są reprezentowane przez każdą różnicę średnich. Na przykład cztery z 20 nie miały różnicy między średnimi grupy kontrolnej i leczonej. Stanowi to 20% z 20 konfiguracji wymienionych powyżej.
- -2 za 10%
- -1,33 za 10%
- -0,667 za 20%
- 0 za 20%
- 0,667 za 20%
- 1,33 za 10%
- 2 za 10%.
Tutaj porównujemy tę listę z naszym zaobserwowanym wynikiem. Nasza losowa selekcja myszy do grup leczonych i kontrolnych dała średnią różnicę 2 sekund. Widzimy również, że różnica ta odpowiada 10% wszystkich możliwych próbek. W rezultacie do tego badania mamy wartość p 10%.