Jednym z celów statystyki jest uporządkowanie danych w znaczący sposób. Dwukierunkowe tabele są ważnym sposobem na zorganizowanie określonego rodzaju sparowane dane. Podobnie jak w przypadku budowy dowolnych wykresów lub tabel w statystykach, bardzo ważna jest znajomość typów zmiennych, z którymi pracujemy. Jeśli mamy dane ilościowe, to wykres taki jak histogram lub działka łodygi i liścia należy użyć. Jeśli mamy dane kategoryczne, to wykres słupkowy lub wykres kołowy jest odpowiednie.
Podczas pracy ze sparowanymi danymi musimy zachować ostrożność. Istnieje wykres rozrzutu dla sparowanych danych ilościowych, ale jaki rodzaj wykresu jest dla sparowanego kategoryczny dane? Ilekroć mamy dwie zmienne jakościowe, powinniśmy używać tabeli dwukierunkowej.
Opis tabeli dwukierunkowej
Po pierwsze, przypominamy, że dane kategoryczne dotyczą cech lub kategorii. Nie ma charakteru ilościowego i nie ma wartości liczbowych.
Tabela dwukierunkowa zawiera listę wszystkich wartości lub poziomów dla dwóch zmiennych kategorialnych. Wszystkie wartości jednej ze zmiennych są wymienione w kolumnie pionowej. Wartości dla drugiej zmiennej są wymienione wzdłuż poziomego rzędu. Jeśli pierwsza zmienna ma
m wartości, a druga zmienna ma n wartości, wtedy będzie suma mn wpisy w tabeli. Każdy z tych wpisów odpowiada określonej wartości dla każdej z dwóch zmiennych.Wzdłuż każdego wiersza i wzdłuż każdej kolumny wpisy są sumowane. Te sumy są ważne przy określaniu rozkładów krańcowych i warunkowych. Te sumy są również ważne, gdy przeprowadzamy test chi-kwadrat na niezależność.
Przykład tabeli dwukierunkowej
Rozważymy na przykład sytuację, w której przyjrzymy się kilku sekcjom kursu statystycznego na uniwersytecie. Chcemy zbudować tablicę dwukierunkową, aby określić, jakie ewentualne różnice występują między mężczyznami i kobietami w trakcie. Aby to osiągnąć, liczymy liczbę każdej oceny literowej, którą zarobili członkowie każdej płci.
Zauważamy, że pierwszą zmienną kategoryczną jest płeć i istnieją dwie możliwe wartości w badaniu mężczyzn i kobiet. Druga zmienna kategorialna dotyczy oceny literowej, a A, B, C, D i F. mają pięć wartości. Oznacza to, że będziemy mieli tabelę dwukierunkową z 2 x 5 = 10 pozycji, a także dodatkowy wiersz i dodatkową kolumnę, które będą potrzebne do tabelarycznego podsumowania wiersza i kolumny.
Nasze dochodzenie pokazuje, że:
- 50 mężczyzn uzyskało A, a 60 kobiet - A.
- 60 mężczyzn zdobyło B., a 80 kobiet - B.
- 100 mężczyzn zdobyło C, a 50 kobiet zdobyło C.
- 40 mężczyzn uzyskało D., a 50 kobiet - D.
- 30 mężczyzn uzyskało ocenę F, a 20 kobiet uzyskało ocenę F
Informacje te wprowadza się do tabeli dwukierunkowej poniżej. Suma każdego wiersza mówi nam, ile z każdego rodzaju ocen zostało zdobytych. Sumy kolumnowe pokazują nam liczbę mężczyzn i liczbę kobiet.
Znaczenie tabel dwukierunkowych
Tabele dwukierunkowe pomagają uporządkować nasze dane, gdy mamy dwie zmienne jakościowe. Ta tabela może pomóc nam w porównaniu dwóch różnych grup w naszych danych. Na przykład, moglibyśmy wziąć pod uwagę względną wydajność mężczyzn na kursie statystycznym względem wydajności kobiet na kursie.
Następne kroki
Po utworzeniu tabeli dwukierunkowej następnym krokiem może być statystyczna analiza danych. Możemy zapytać, czy zmienne, które są w badaniu, są od siebie niezależne, czy nie. Aby odpowiedzieć na to pytanie, możemy zastosować test chi-kwadrat na stole dwukierunkowym.
Dwukierunkowy stół dla klas i płci
Męski | Płeć żeńska | Całkowity | |
ZA | 50 | 60 | 110 |
b | 60 | 80 | 140 |
do | 100 | 50 | 150 |
re | 40 | 50 | 90 |
fa | 30 | 20 | 50 |
Całkowity | 280 | 260 | 540 |