Nachylenie linii regresji i współczynnik korelacji

Wiele razy w badaniu Statystyka ważne jest, aby tworzyć połączenia między różnymi tematami. Zobaczymy przykład tego, w którym nachylenie linii regresji jest bezpośrednio związane z Współczynnik korelacji. Ponieważ obie te koncepcje dotyczą linii prostych, naturalne jest pytanie: „Jaka jest wartość współczynnika korelacji i najmniejsza kwadratowa linia związane z?"

Najpierw przyjrzymy się podstawom dotyczącym obu tych tematów.

Szczegóły dotyczące korelacji

Ważne jest, aby pamiętać szczegóły dotyczące współczynnika korelacji, który jest oznaczony przez r. Ta statystyka jest używana po sparowaniu dane ilościowe. Z wykresu rozrzutu sparowane dane, możemy szukać trendów w ogólnej dystrybucji danych. Niektóre sparowane dane wykazują wzór liniowy lub prosty. Ale w praktyce dane nigdy nie mieszczą się dokładnie w linii prostej.

Kilka osób patrzy na to samo wykres punktowy sparowanych danych nie zgodziłoby się, jak blisko było pokazania ogólnego trendu liniowego. W końcu nasze kryteria mogą być nieco subiektywne. Używana przez nas skala może również wpływać na nasze postrzeganie danych. Z tych i innych powodów potrzebujemy pewnego rodzaju obiektywnej miary, aby stwierdzić, jak blisko nasze sparowane dane są liniowe. Współczynnik korelacji osiąga to dla nas.

instagram viewer

Kilka podstawowych faktów na temat r zawierać:

  • Wartość r waha się między dowolną liczbą rzeczywistą od -1 do 1.
  • Wartości r blisko 0 oznacza, że ​​między danymi istnieje niewielka lub żadna liniowa zależność.
  • Wartości r blisko 1 oznacza, że ​​istnieje pozytywna liniowa zależność między danymi. Oznacza to, że jako x zwiększa to y również wzrasta.
  • Wartości r blisko -1 oznacza, że ​​istnieje ujemna liniowa zależność między danymi. Oznacza to, że jako x zwiększa to y zmniejsza się.

Nachylenie linii najmniejszych kwadratów

Ostatnie dwa elementy z powyższej listy wskazują nam kierunek nachylenia linii najmniejszego kwadratu o najlepszym dopasowaniu. Przypomnij sobie, że nachylenie linii jest miarą tego, ile jednostek idzie w górę lub w dół dla każdej jednostki, którą przesuwamy w prawo. Czasami określa się to jako wzrost linii podzielonej przez przebieg lub zmianę y wartości podzielone przez zmianę w x wartości.

Zasadniczo linie proste mają nachylenia dodatnie, ujemne lub zerowe. Gdybyśmy zbadali nasze linie regresji najmniejszych kwadratów i porównali odpowiednie wartości r, zauważamy, że za każdym razem, gdy nasze dane mają ujemny współczynnik korelacji, nachylenie linii regresji jest ujemne. Podobnie, za każdym razem, gdy mamy dodatni współczynnik korelacji, nachylenie linii regresji jest dodatnie.

Z tej obserwacji powinno wynikać, że istnieje wyraźny związek między znakiem współczynnika korelacji a nachyleniem linii najmniejszych kwadratów. Pozostaje wyjaśnienie, dlaczego tak jest.

Wzór na nachylenie

Przyczyna związku między wartością r a nachylenie linii najmniejszych kwadratów ma związek ze wzorem, który daje nam nachylenie tej linii. W przypadku sparowanych danych (x, y) oznaczamy odchylenie standardowe z x dane wg sx i standardowe odchylenie dla y dane wg sy.

Wzór na nachylenie za linii regresji jest:

  • a = r (sy/ sx)

Obliczenie odchylenia standardowego polega na przyjęciu dodatniego pierwiastka kwadratowego z liczby nieujemnej. W rezultacie oba standardowe odchylenia we wzorze dla nachylenia muszą być nieujemne. Jeśli założymy, że istnieją pewne różnice w naszych danych, będziemy mogli zignorować możliwość, że którekolwiek z tych standardowych odchyleń wynosi zero. Dlatego znak współczynnika korelacji będzie taki sam jak znak nachylenia linii regresji.

instagram story viewer