Wiele razy, gdy badamy grupę, naprawdę porównujemy dwie populacje. W zależności od parametr z tej grupy jesteśmy zainteresowani, a warunki, z którymi mamy do czynienia, jest dostępnych kilka technik. Statystyczny wnioskowanie procedury dotyczące porównania dwóch populacji zwykle nie mogą być stosowane do trzech lub więcej populacji. Aby zbadać więcej niż dwie populacje jednocześnie, potrzebujemy różnych rodzajów narzędzi statystycznych. Analiza wariancjilub ANOVA to technika interferencji statystycznej, która pozwala nam radzić sobie z kilkoma populacjami.
Porównanie środków
Aby zobaczyć, jakie pojawiają się problemy i dlaczego potrzebujemy ANOVA, rozważymy przykład. Załóżmy, że próbujemy ustalić, czy oznaczać wagi zielonych, czerwonych, niebieskich i pomarańczowych cukierków M&M różnią się od siebie. Podamy średnie wagi dla każdej z tych populacji, μ1, μ2, μ3 μ4 i odpowiednio. Możemy użyć odpowiedniego test hipotez kilka razy i przetestuj C (4,2) lub sześć różnych zerowe hipotezy:
- H.0: μ 1 = μ2 aby sprawdzić, czy średnia waga populacji czerwonych cukierków jest inna niż średnia waga populacji niebieskich cukierków.
- H.0: μ2 = μ3 aby sprawdzić, czy średnia waga populacji niebieskich cukierków jest inna niż średnia waga populacji zielonych cukierków.
- H.0: μ3 = μ4 sprawdzić, czy średnia waga populacji zielonych cukierków jest inna niż średnia masa populacji pomarańczowych cukierków.
- H.0: μ4 = μ1 sprawdzić, czy średnia waga populacji pomarańczowych cukierków jest inna niż średnia waga populacji czerwonych cukierków.
- H.0: μ1 = μ3 aby sprawdzić, czy średnia waga populacji czerwonych cukierków jest inna niż średnia waga populacji zielonych cukierków.
- H.0: μ2 = μ4 aby sprawdzić, czy średnia waga populacji niebieskich cukierków jest inna niż średnia waga populacji pomarańczowych cukierków.
Istnieje wiele problemów z tego rodzaju analizami. Będziemy mieli sześć p-wartości. Mimo że możemy przetestować każdy na 95% poziom pewności siebie, nasze zaufanie do całego procesu jest mniejsze, ponieważ prawdopodobieństwa się mnożą: 0,95 x .95 x .95 x .95 x .95 x .95 to w przybliżeniu 0,74 lub 74% poziom ufności. Tak więc wzrosło prawdopodobieństwo błędu typu I.
Na bardziej fundamentalnym poziomie nie możemy porównać tych czterech parametrów jako całości, porównując je dwa na raz. Średnie czerwone i niebieskie M&M mogą być znaczące, przy czym średnia masa czerwieni jest względnie większa niż średnia masa niebieskiego. Jednak biorąc pod uwagę średnią wagę wszystkich czterech rodzajów cukierków, może nie być znaczącej różnicy.
Analiza wariancji
Aby poradzić sobie z sytuacjami, w których musimy dokonać wielu porównań, używamy ANOVA. Ten test pozwala nam wziąć pod uwagę parametry kilku populacji jednocześnie, bez wchodzenia w niektóre problemy, z którymi się spotykamy przeprowadzanie testów hipotez na dwa parametry jednocześnie.
Aby przeprowadzić ANOVA z powyższym przykładem M&M, sprawdzilibyśmy hipotezę zerową H0:μ1 = μ2 = μ3= μ4. Stwierdza to, że nie ma różnicy między średnimi wagami czerwonego, niebieskiego i zielonego M & M. Alternatywna hipoteza jest taka, że istnieje pewna różnica między średnimi wagami czerwonego, niebieskiego, zielonego i pomarańczowego M & Ms. Ta hipoteza jest tak naprawdę kombinacją kilku stwierdzeń H.za:
- Średnia waga populacji czerwonych cukierków nie jest równa średniej masie populacji niebieskich cukierków, OR
- Średnia waga populacji niebieskich cukierków nie jest równa średniej masie populacji zielonych cukierków, OR
- Średnia waga populacji zielonych cukierków nie jest równa średniej masie populacji pomarańczowych cukierków, OR
- Średnia waga populacji zielonych cukierków nie jest równa średniej masie populacji czerwonych cukierków, OR
- Średnia waga populacji niebieskich cukierków nie jest równa średniej masie populacji pomarańczowych cukierków, OR
- Średnia waga populacji niebieskich cukierków nie jest równa średniej masie populacji czerwonych cukierków.
W tym konkretnym przypadku, aby uzyskać naszą wartość p, użylibyśmy a rozkład prawdopodobieństwa znany jako Rozkład F.. Obliczenia obejmujące test ANOVA F można wykonać ręcznie, ale zwykle są one obliczane za pomocą oprogramowania statystycznego.
Wiele porównań
Tym, co odróżnia ANOVA od innych technik statystycznych, jest to, że służy ono do wielokrotnych porównań. Jest to powszechne w statystykach, ponieważ wiele razy chcemy porównać więcej niż tylko dwie grupy. Zazwyczaj ogólny test sugeruje, że istnieje pewna różnica między badanymi parametrami. Następnie przeprowadzamy ten test z kilkoma innymi analizami, aby zdecydować, który parametr się różni.