Jakie są pozostałości?

Regresja liniowa jest narzędziem statystycznym, które określa, jak dobrze linia prosta pasuje do zestawu sparowane dane. Linia prosta, która najlepiej pasuje do tych danych, nazywa się linią regresji najmniejszych kwadratów. Z tej linii można korzystać na wiele sposobów. Jednym z tych zastosowań jest oszacowanie wartości zmiennej odpowiedzi dla danej wartości zmiennej objaśniającej. Powiązany z tym pomysłem jest pomysł resztkowy.

(1, 2), (2, 3), (3, 7), (3, 6), (4, 9), (5, 9)

Aby obliczyć pozostałość w punktach x = 5, odejmujemy przewidywaną wartość od naszej wartości obserwowanej. Od czasu y Współrzędna naszego punktu danych wynosiła 9, co daje resztę 9-10 = -1.

Istnieje kilka zastosowań pozostałości. Jednym z zastosowań jest pomoc w ustaleniu, czy mamy zestaw danych, który ma ogólny trend liniowy, czy też powinniśmy rozważyć inny model. Powodem tego jest to, że reszty pomagają wzmocnić dowolny nieliniowy wzór w naszych danych. To, co może być trudne do zobaczenia, patrząc na wykres rozrzutu, można łatwiej zaobserwować, badając resztki i odpowiadający im wykres resztkowy.

instagram viewer

Innym powodem do rozważenia reszt jest sprawdzenie, czy spełnione są warunki wnioskowania dla regresji liniowej. Po weryfikacji trendu liniowego (poprzez sprawdzenie reszt) sprawdzamy również rozkład reszt. Aby móc wnioskować o regresji, chcemy, aby reszty wokół naszej linii regresji były w przybliżeniu normalnie rozłożone. ZA histogram lub wątek reszt pomoże zweryfikować, czy ten warunek został spełniony.