W Statystyka, termin „solidność” oznacza wytrzymałość modelu statystycznego, testów i procedur zgodnie ze szczególnymi warunkami analizy statystycznej, którą badanie ma nadzieję osiągnąć. Biorąc pod uwagę, że te warunki badania są spełnione, modele można zweryfikować pod kątem prawdziwości za pomocą dowodów matematycznych.
Wiele modeli opiera się na idealnych sytuacjach, które nie istnieją podczas pracy z rzeczywistymi danymi, w wyniku czego model może zapewniać prawidłowe wyniki, nawet jeśli warunki nie są dokładnie spełnione.
Dlatego solidne statystyki to wszelkie statystyki, które dają dobrą wydajność, gdy dane są pobierane z szerokiego zakresu rozkłady prawdopodobieństwa, na które w dużej mierze nie wpływają wartości odstające lub niewielkie odstępstwa od założeń modelowych w danej zestaw danych. Innymi słowy, solidna statystyka jest odporna na błędy w wynikach.
Jednym ze sposobów na obserwację powszechnie stosowanej solidnej procedury statystycznej jest poszukiwanie procedur t, które wykorzystują testy hipotez w celu ustalenia najdokładniejszych prognoz statystycznych.
Przestrzeganie procedur T.
Jako przykład solidności rozważymy t-procedury, które obejmują przedział ufności dla średniej populacji z nieznanym odchyleniem standardowym populacji, a także testów hipotez dotyczących średniej populacji.
Sposób użycia t-procedury zakładają, co następuje:
- Zestaw danych, z którymi pracujemy to prosta losowa próbka populacji.
- Populacja, z której pobraliśmy próbki, jest zwykle podzielona.
W praktyce z rzeczywistymi przykładami statystycy rzadko mają populację, która jest normalnie rozmieszczona, więc pytanie brzmi: „Jak silni są t-procedury? ”
Zasadniczo warunek, że mamy prostą próbę losową, jest ważniejszy niż warunek, z którego pobraliśmy próbki z populacji normalnie rozmieszczonej; Powodem tego jest to, że centralne twierdzenie graniczne zapewnia przybliżony rozkład próbkowania normal - im większa jest nasza próbka, tym bliżej jest do tego rozkładu próbkowania średniej próbki normalna.
Jak działają procedury T jako solidne statystyki
Tak solidność dla t-procedury zależą od wielkości próbki i rozkładu naszej próbki. Rozważania tego obejmują:
- Jeśli wielkość próbek jest duża, co oznacza, że mamy 40 lub więcej obserwacji, to t-procedury mogą być stosowane nawet w przypadku wypaczonych rozkładów.
- Jeśli wielkość próbki wynosi od 15 do 40, możemy użyć t-procedury dla dowolnego ukształtowanego rozkładu, chyba że występują wartości odstające lub wysoki stopień wypaczenia.
- Jeśli wielkość próbki jest mniejsza niż 15, możemy użyć t- procedury dla danych, które nie mają wartości odstających, jednego piku i są prawie symetryczne.
W większości przypadków odporność została ustalona poprzez prace techniczne w dziedzinie statystyki matematycznej oraz na szczęście niekoniecznie musimy wykonywać te zaawansowane obliczenia matematyczne, aby poprawnie wykorzystać je; musimy jedynie zrozumieć, jakie są ogólne wytyczne dotyczące niezawodności naszej konkretnej metody statystycznej.
Procedury T funkcjonują jako solidne statystyki, ponieważ zazwyczaj dają dobrą wydajność dla tych modeli, biorąc pod uwagę wielkość próbki jako podstawę do zastosowania procedury.