Przykład testu permutacji

Jedno pytanie, które zawsze jest ważne Statystyka to: „Czy zaobserwowany wynik wynika wyłącznie z przypadku, czy jest nim statystycznie znaczące? Jedna klasa testy hipotez, zwane testami permutacji, pozwalają nam przetestować to pytanie. Przegląd i kroki takiego testu to:

  • Podzieliliśmy naszych badanych na grupę kontrolną i eksperymentalną. Hipotezą zerową jest to, że nie ma różnicy między tymi dwiema grupami.
  • Zastosuj leczenie w grupie eksperymentalnej.
  • Zmierz odpowiedź na leczenie
  • Rozważ każdą możliwą konfigurację grupy eksperymentalnej i obserwowaną odpowiedź.
  • Oblicz wartość p na podstawie naszej zaobserwowanej odpowiedzi w odniesieniu do wszystkich potencjalnych grup eksperymentalnych.

To jest zarys permutacji. Dla uproszczenia tego szkicu poświęcimy czas na szczegółowe przeanalizowanie opracowanego przykładu takiego testu permutacji.

Przykład

Załóżmy, że badamy myszy. W szczególności interesuje nas, jak szybko myszy kończą labirynt, z którym nigdy wcześniej się nie spotkały. Chcemy przedstawić dowody na korzyść eksperymentalnego leczenia. Celem jest wykazanie, że myszy w grupie leczonej rozwiążą labirynt szybciej niż myszy nieleczone.

instagram viewer

Zaczynamy od naszych badanych: sześć myszy. Dla wygody myszy będą oznaczane literami A, B, C, D, E, F. Trzy z tych myszy zostaną losowo wybrane do eksperymentalnego leczenia, a pozostałe trzy zostaną umieszczone w grupie kontrolnej, w której osobnicy otrzymują placebo.

Następnie losowo wybierzemy kolejność wybierania myszy do labiryntu. Zostanie odnotowany czas spędzony na ukończeniu labiryntu dla wszystkich myszy i zostanie obliczona średnia dla każdej grupy.

Załóżmy, że nasza losowa selekcja obejmuje myszy A, C i E w grupie eksperymentalnej, a inne myszy w placebo Grupa kontrolna. Po wdrożeniu leczenia losowo wybieramy kolejność, w której myszy biegną przez labirynt.

Czasy przebiegu dla każdej myszy są następujące:

  • Mysz A uruchamia wyścig w 10 sekund
  • Mysz B prowadzi wyścig w 12 sekund
  • Mysz C prowadzi wyścig w 9 sekund
  • Mysz D uruchamia wyścig w 11 sekund
  • Mysz E prowadzi wyścig w 11 sekund
  • Mysz F uruchamia wyścig w 13 sekund.

Średni czas ukończenia labiryntu myszy w grupie eksperymentalnej wynosi 10 sekund. Średni czas na ukończenie labiryntu w grupie kontrolnej wynosi 12 sekund.

Moglibyśmy zadać kilka pytań. Czy leczenie naprawdę jest przyczyną szybszego średniego czasu? A może mieliśmy po prostu szczęście w naszej grupie kontrolnej i eksperymentalnej? Leczenie mogło nie przynieść żadnego efektu i losowo wybraliśmy wolniejsze myszy do otrzymania placebo i szybsze myszy do otrzymania leczenia. Test permutacji pomoże odpowiedzieć na te pytania.

Hipotezy

Hipotezami dla naszego testu permutacji są:

  • The Hipoteza zerowa jest stwierdzeniem braku efektu. W tym konkretnym teście mamy H0: Nie ma różnicy między grupami leczenia. Średni czas uruchomienia labiryntu dla wszystkich myszy bez leczenia jest taki sam jak średni czas dla wszystkich myszy poddanych leczeniu.
  • Alternatywna hipoteza jest tym, na co staramy się ustalić dowody. W takim przypadku mielibyśmy Hza: Średni czas dla wszystkich myszy poddanych leczeniu będzie szybszy niż średni czas dla wszystkich myszy bez leczenia.

Permutacje

Jest sześć myszy i są trzy miejsca w grupie eksperymentalnej. Oznacza to, że liczba możliwych grup eksperymentalnych jest określona liczbą kombinacji C (6,3) = 6! / (3! 3!) = 20. Pozostałe osoby byłyby częścią grupy kontrolnej. Istnieje więc 20 różnych sposobów losowego wyboru osób z naszych dwóch grup.

Przypisanie A, C i E do grupy eksperymentalnej przeprowadzono losowo. Ponieważ istnieje 20 takich konfiguracji, konkretna konfiguracja z A, C i E w grupie eksperymentalnej ma prawdopodobieństwo 1/20 = 5% wystąpienia.

Musimy ustalić wszystkie 20 konfiguracji eksperymentalnej grupy osób w naszym badaniu.

  1. Grupa eksperymentalna: A B C i grupa kontrolna: D E F
  2. Grupa eksperymentalna: A B D i grupa kontrolna: C E F
  3. Grupa eksperymentalna: A B E i grupa kontrolna: C D F
  4. Grupa eksperymentalna: A B F i grupa kontrolna: C D E
  5. Grupa eksperymentalna: A C D i grupa kontrolna: B E F
  6. Grupa eksperymentalna: A C E i grupa kontrolna: B D F
  7. Grupa eksperymentalna: A C F i grupa kontrolna: B D E
  8. Grupa eksperymentalna: A D E i grupa kontrolna: B C F
  9. Grupa eksperymentalna: A D F i grupa kontrolna: B C E
  10. Grupa eksperymentalna: A E F i grupa kontrolna: B C D
  11. Grupa eksperymentalna: B C D i Grupa kontrolna: A E F
  12. Grupa eksperymentalna: B C E i grupa kontrolna: A D F
  13. Grupa eksperymentalna: B C F i Grupa kontrolna: A D E
  14. Grupa eksperymentalna: B D E i grupa kontrolna: A C F
  15. Grupa eksperymentalna: B D F i grupa kontrolna: A C E
  16. Grupa eksperymentalna: B E F i grupa kontrolna: A C D
  17. Grupa eksperymentalna: C D E i grupa kontrolna: A B F.
  18. Grupa eksperymentalna: C D F i grupa kontrolna: A B E
  19. Grupa eksperymentalna: C E F i grupa kontrolna: A B D
  20. Grupa eksperymentalna: D E F i grupa kontrolna: A B C

Następnie przyglądamy się każdej konfiguracji grup eksperymentalnych i kontrolnych. Obliczamy średnią dla każdej z 20 permutacji z powyższej listy. Na przykład dla pierwszego A, B i C mają czasy odpowiednio 10, 12 i 9. Średnia z tych trzech liczb wynosi 10,3333. Również w tej pierwszej permutacji D, E i F mają czasy odpowiednio 11, 11 i 13. Ma to średnio 11.6666.

Po obliczeniu średnia z każdej grupy, obliczamy różnicę między tymi średnimi. Każde z poniższych odpowiada różnicy między grupami eksperymentalną i kontrolną, które zostały wymienione powyżej.

  1. Placebo - leczenie = 1,333333333 sekundy
  2. Placebo - leczenie = 0 sekund
  3. Placebo - leczenie = 0 sekund
  4. Placebo - leczenie = -1.333333333 sekund
  5. Placebo - leczenie = 2 sekundy
  6. Placebo - leczenie = 2 sekundy
  7. Placebo - leczenie = 0,6666666667 sekund
  8. Placebo - leczenie = 0,6666666667 sekund
  9. Placebo - leczenie = -0,666666667 sekund
  10. Placebo - leczenie = -0,666666667 sekund
  11. Placebo - leczenie = 0,6666666667 sekund
  12. Placebo - leczenie = 0,6666666667 sekund
  13. Placebo - leczenie = -0,666666667 sekund
  14. Placebo - leczenie = -0,666666667 sekund
  15. Placebo - leczenie = -2 sekundy
  16. Placebo - leczenie = -2 sekundy
  17. Placebo - leczenie = 1,333333333 sekundy
  18. Placebo - leczenie = 0 sekund
  19. Placebo - leczenie = 0 sekund
  20. Placebo - leczenie = -1.333333333 sekund

Wartość p

Teraz oceniamy różnice między średnimi z każdej grupy, które zauważyliśmy powyżej. Tabelujemy również odsetek naszych 20 różnych konfiguracji, które są reprezentowane przez każdą różnicę średnich. Na przykład cztery z 20 nie miały różnicy między średnimi grupy kontrolnej i leczonej. Stanowi to 20% z 20 konfiguracji wymienionych powyżej.

  • -2 za 10%
  • -1,33 za 10%
  • -0,667 za 20%
  • 0 za 20%
  • 0,667 za 20%
  • 1,33 za 10%
  • 2 za 10%.

Tutaj porównujemy tę listę z naszym zaobserwowanym wynikiem. Nasza losowa selekcja myszy do grup leczonych i kontrolnych dała średnią różnicę 2 sekund. Widzimy również, że różnica ta odpowiada 10% wszystkich możliwych próbek. W rezultacie do tego badania mamy wartość p 10%.

instagram story viewer