Jednym z celów statystyki jest organizacja i wyświetlanie danych. Wiele razy jednym ze sposobów jest użycie wykres, wykres lub tabela. Podczas pracy z sparowane dane, przydatnym rodzajem wykresu jest wykres rozrzutu. Ten typ wykresu pozwala nam łatwo i skutecznie eksplorować nasze dane poprzez badanie rozproszenia punktów w płaszczyźnie.
Sparowane dane
Warto podkreślić, że wykres rozproszenia jest rodzajem wykresu stosowanym dla sparowanych danych. Jest to rodzaj zestawu danych, w którym z każdym naszym punktem danych są powiązane dwie liczby. Typowe przykłady takich par obejmują:
- Pomiar przed i po zabiegu. Może to przybrać formę występu studenta na teście wstępnym, a następnie późniejszym.
- Dopasowany pary eksperymentalny projekt. Tutaj jeden osobnik jest w grupie kontrolnej, a inny podobny osobnik jest w grupie leczonej.
- Dwa pomiary od tej samej osoby. Na przykład możemy zarejestrować wagę i wzrost 100 osób.
Wykresy 2D
Puste płótno, od którego zaczniemy dla naszego wykresu rozrzutu, to kartezjański układ współrzędnych. Nazywa się to również prostokątnym układem współrzędnych, ponieważ każdy punkt można zlokalizować poprzez narysowanie określonego prostokąta. Prostokątny układ współrzędnych można skonfigurować:
- Zaczynając od poziomej linii liczbowej. To się nazywa x-oś.
- Dodaj pionową linię liczbową. Przecinaj się x-oś w taki sposób, że przecina się punkt zerowy z obu linii. Ta druga linia liczbowa nosi nazwę y-oś.
- Punkt przecięcia zer naszej linii liczbowej nazywa się początkiem.
Teraz możemy wykreślić nasze punkty danych. Pierwszą liczbą w naszej parze jest x-koordynować. Jest to odległość pozioma od osi y, a zatem również jej początek. Przechodzimy w prawo, aby uzyskać dodatnie wartości x i po lewej stronie źródła dla wartości ujemnych x.
Drugi numer w naszej parze to y-koordynować. Jest to odległość w pionie od osi x. Począwszy od pierwotnego punktu na x-osi, przejdź w górę, aby uzyskać dodatnie wartości y i w dół dla ujemnych wartości y.
Lokalizacja na naszym wykresie jest następnie oznaczona kropką. Powtarzamy ten proces w kółko dla każdego punktu w naszym zbiorze danych. Rezultatem jest rozproszenie punktów, co nadaje nazwę wykresowi rozrzutu.
Wyjaśnienie i odpowiedź
Jedną ważną instrukcją, która pozostaje, jest ostrożność, która zmienna jest na której osi. Jeśli nasze sparowane dane obejmują wyjaśnienie i odpowiedź po sparowaniu, wówczas zmienna objaśniająca jest wskazana na osi x. Jeśli obie zmienne są uważane za objaśniające, możemy wybrać, która ma zostać narysowana na osi x, a która na y-oś.
Funkcje wykresu rozrzutu
Istnieje kilka ważnych cech wykresu rozrzutu. Identyfikując te cechy, możemy odkryć więcej informacji o naszym zbiorze danych. Funkcje te obejmują:
- Ogólny trend wśród naszych zmiennych. Jak czytamy od lewej do prawej, jaki jest duży obraz? Wzór w górę, w dół czy cyklicznie?
- Wszelkie wartości odstające od ogólnego trendu. Czy te wartości odstające od reszty naszych danych, czy wpływają na te punkty?
- Kształt każdego trendu. Czy to jest liniowe, wykładnicze, logarytmiczne czy coś innego?
- Siła każdego trendu. W jakim stopniu dane pasują do zidentyfikowanego przez nas ogólnego wzorca?
Powiązane tematy
Wykresy rozrzutu wykazujące trend liniowy można analizować za pomocą technik statystycznychregresja liniowa i korelacja. Regresję można wykonać dla innych rodzajów trendów, które są nieliniowe.