Test Runs dla sekwencji losowych

Dawać sekwencja danych, jednym z pytań, które możemy się zastanawiać, jest to, czy sekwencja pojawiła się na skutek zjawisk przypadkowych, czy też dane nie są losowe. Losowość jest trudna do zidentyfikowania, ponieważ bardzo trudno jest po prostu spojrzeć na dane i ustalić, czy zostały one wygenerowane przypadkowo. Jedną z metod, która może być użyta do ustalenia, czy sekwencja rzeczywiście wystąpiła przypadkowo, jest nazywana testem przebiegu.

Test przebiegu jest testem istotności lub test hipotez. Procedura tego testu oparta jest na przebiegu lub sekwencji danych, które mają określoną cechę. Aby zrozumieć, jak działa test uruchomień, musimy najpierw zbadać koncepcję uruchomienia.

Sekwencje danych

Zaczniemy od przykładu biegów. Rozważ następującą sekwencję losowych cyfr:

6 2 7 0 0 1 7 3 0 5 0 8 4 6 8 7 0 6 5 5

Jednym ze sposobów klasyfikacji tych cyfr jest podzielenie ich na dwie kategorie, parzyste (w tym cyfry 0, 2, 4, 6 i 8) lub nieparzyste (w tym cyfry 1, 3, 5, 7 i 9). Przyjrzymy się sekwencji losowych cyfr i oznaczymy liczby parzyste jako E, a liczby nieparzyste jako O:

instagram viewer

E E O E E O O E O E E E E E O E E O O

Przebiegi są łatwiejsze do zauważenia, jeśli przepisujemy to tak, aby wszystkie Os były razem, a wszystkie Es były razem:

EE O EE OO E O EEEEE O EE OO

Bieżemy liczbę bloków liczb parzystych lub nieparzystych i widzimy, że dla danych istnieje łącznie dziesięć przebiegów. Cztery przebiegi mają długość pierwszą, pięć długości dwa, a jeden długość pięć

Warunki

Z jakimkolwiek test znaczenia, ważne jest, aby wiedzieć, jakie warunki są konieczne do przeprowadzenia testu. W przypadku testu przeprowadzeniowego będziemy mogli sklasyfikować każdą wartość danych z próbki do jednej z dwóch kategorii. Policzymy całkowitą liczbę przebiegów w stosunku do liczby wartości danych należących do każdej kategorii.

Test będzie test dwustronny. Powodem tego jest to, że zbyt mała liczba przebiegów oznacza, że ​​prawdopodobnie nie ma wystarczającej zmienności i liczby przebiegów, które wystąpiłyby w procesie losowym. Spowoduje to zbyt wiele przebiegów, gdy proces będzie zbyt często przełączał się między kategoriami, aby przypadkowo je opisać.

Hipotezy i wartości P.

Każdy test znaczenia ma zero i hipoteza alternatywna. W przypadku testu przebiegów hipotezą zerową jest to, że sekwencja jest sekwencją losową. Alternatywna hipoteza jest taka, że ​​sekwencja przykładowych danych nie jest losowa.

Oprogramowanie statystyczne może obliczyć wartość p co odpowiada określonej statystyce testu. Istnieją również tabele, które podają liczby krytyczne poziom istotności dla całkowitej liczby przebiegów.

Uruchamia przykładowy test

Przeanalizujemy następujący przykład, aby zobaczyć, jak działa test uruchamiania. Załóżmy, że w przypadku zadania student jest proszony o rzut monetą 16 razy i odnotowanie kolejności pokazanych głów i ogonów. Jeśli otrzymamy ten zestaw danych:

H T H H H T T H T T H T H T H H

Możemy zapytać, czy uczeń rzeczywiście odrobił pracę domową, czy też oszukał i napisał serię H i T, które wyglądają losowo? Test przebiegu może nam pomóc. Założenia są spełnione dla testu biegowego, ponieważ dane można podzielić na dwie grupy, jako głowę lub ogon. Kontynuujemy, licząc liczbę przebiegów. Po przegrupowaniu widzimy:

H T HHH TT H TT H T H T HH

Istnieje dziesięć przebiegów dla naszych danych, a siedem ogonów to dziewięć głów.

Hipotezą zerową jest to, że dane są losowe. Alternatywą jest to, że nie jest losowy. Dla poziomu istotności alfa równego 0,05 widzimy, sprawdzając odpowiednią tabelę, że odrzucamy hipotezę zerową, gdy liczba przebiegów jest mniejsza niż 4 lub większa niż 16. Ponieważ w naszych danych jest dziesięć przebiegów, my nie odrzucić hipoteza zerowa H0.

Normalne zbliżenie

Test przebiegu jest przydatnym narzędziem do ustalenia, czy sekwencja może być losowa, czy nie. W przypadku dużego zestawu danych czasami można zastosować normalne przybliżenie. To normalne przybliżenie wymaga od nas zastosowania liczby elementów w każdej kategorii, a następnie obliczenia średniej i odchylenia standardowego odpowiedniej normalna dystrybucja.

instagram story viewer