Co to są sparowane dane w statystykach?

Sparowane dane w statystykach, często nazywane parami uporządkowanymi, odnoszą się do dwóch zmiennych w osobnikach populacji, które są ze sobą połączone w celu ustalenia korelacji między nimi. Aby zestaw danych mógł zostać uznany za dane sparowane, obie te wartości danych muszą zostać połączone lub połączone ze sobą i nie mogą być rozpatrywane osobno.

Idea sparowanych danych jest przeciwstawiona zwykłemu powiązaniu jednej liczby z każdym punktem danych, jak w innych dane ilościowe ustawia w ten sposób, że każdy pojedynczy punkt danych jest powiązany z dwiema liczbami, zapewniając wykres, który pozwala statystycznym obserwować związek między tymi zmiennymi w populacji.

Tę metodę sparowanych danych stosuje się, gdy badanie ma na celu porównanie dwóch zmiennych u osób w populacji w celu wyciągnięcia wniosków na temat zaobserwowanej korelacji. Obserwując te punkty danych, kolejność parowania jest ważna, ponieważ pierwsza liczba jest miarą jednej rzeczy, a druga miarą czegoś zupełnie innego.

Przykład sparowanych danych

instagram viewer

Aby zobaczyć przykład sparowanych danych, załóżmy, że nauczyciel zlicza liczbę zadań domowych każdego ucznia oddał dla określonej jednostki, a następnie sparował tę liczbę z procentem każdego ucznia w teście jednostkowym. Pary są następujące:

  • Osoba, która ukończyła 10 zadań, zarobiła 95% na swoim teście. (10, 95%)
  • Osoba, która ukończyła 5 zadań, zarobiła 80% na swoim teście. (5, 80%)
  • Osoba, która ukończyła 9 zadań, zarobiła 85% na swoim teście. (9, 85%)
  • Osoba, która ukończyła 2 zadania, zarobiła 50% na swoim teście. (2, 50%)
  • Osoba, która ukończyła 5 zadań, zarobiła 60% na swoim teście. (5, 60%)
  • Osoba, która ukończyła 3 zadania, zarobiła 70% na swoim teście. (3, 70%)

W każdym z tych zestawów sparowanych danych widzimy, że liczba przypisań jest zawsze na pierwszym miejscu w zamówiona para, podczas gdy procent zarobiony w teście zajmuje drugie miejsce, jak widać w pierwszym przypadku (10, 95%).

Podczas gdy statystyczna analiza tych danych może być również wykorzystana do obliczenia średniej liczby zadania domowe zakończone lub średni wynik testu, mogą pojawić się inne pytania dane. W tym przypadku nauczyciel chce wiedzieć, czy istnieje jakikolwiek związek między liczbą zadań domowych włączył się i wykonał test, a nauczyciel musiałby sparować dane, aby odpowiedzieć na to pytanie pytanie.

Analiza sparowanych danych

The techniki statystyczne z korelacja i regresję stosuje się do analizy sparowanych danych, w których Współczynnik korelacji określa ilościowo, jak blisko dane leżą wzdłuż linii prostej, i mierzy siłę zależności liniowej.

Z drugiej strony regresja jest wykorzystywana w kilku aplikacjach, w tym w określaniu, która linia najlepiej pasuje do naszego zestawu danych. Ta linia może następnie zostać użyta do oszacowania lub prognozy y wartości dla wartości x które nie były częścią naszego oryginalnego zestawu danych.

Istnieje specjalny typ wykresu, który jest szczególnie odpowiedni dla sparowanych danych, zwany wykresem rozproszenia. W tym rodzaj wykresu, jedna oś współrzędnych reprezentuje jedną ilość sparowanych danych, podczas gdy druga oś współrzędnych reprezentuje drugą ilość sparowanych danych.

Wykres rozrzutu dla powyższych danych miałby oś x oznaczającą liczbę oddanych zadań, zaś oś y oznaczałaby wyniki w teście jednostkowym.