Przykład ładowania początkowego w statystykach

Bootstrapping jest potężną techniką statystyczną. Jest to szczególnie przydatne, gdy próba rozmiar, z którym pracujemy jest niewielki. W typowych okolicznościach wielkości próbek poniżej 40 nie można rozwiązać, zakładając, że normalna dystrybucja lub a rozkład t. Techniki bootstrap działają całkiem dobrze z próbkami, które mają mniej niż 40 elementów. Powodem tego jest to, że ładowanie wymaga ponownego próbkowania. Tego rodzaju techniki nie zakładają nic o dystrybucja naszych danych.

Bootstrapping stał się bardziej popularny, ponieważ zasoby komputerowe stały się łatwiej dostępne. Wynika to z faktu, że aby bootstrapowanie było praktyczne, należy użyć komputera. Zobaczymy, jak to działa w poniższym przykładzie ładowania początkowego.

Zaczynamy od próba statystyczna z populacji, o której nic nie wiemy. Naszym celem będzie 90% przedział ufności w odniesieniu do średniej próbki. Chociaż inne techniki statystyczne zostały użyte do ustalenia przedziały ufności zakładamy, że znamy średnią lub standardowe odchylenie naszej populacji, ładowanie początkowe nie wymaga niczego poza próbą.

instagram viewer

Dla celów naszego przykładu założymy, że próbka wynosi 1, 2, 4, 4, 10.

Teraz próbkujemy ponownie z wymianą z naszej próbki, aby utworzyć tak zwane próbki bootstrap. Każda próbka bootstrap będzie miała rozmiar pięciu, podobnie jak nasza oryginalna próbka. Ponieważ losowo wybieramy, a następnie zamieniamy każdą wartość, próbki bootstrap mogą różnić się od oryginalnej próbki i od siebie nawzajem.

Dla przykładów, na które natrafilibyśmy w prawdziwym świecie, dokonalibyśmy tego ponownego próbkowania setki, jeśli nie tysiące razy. Poniżej znajduje się przykład 20 próbek ładowania początkowego:

Ponieważ używamy ładowania początkowego do obliczania przedziału ufności dla średniej populacji, teraz obliczamy średnie dla każdej z naszych próbek ładowania początkowego. Te środki, ułożone w porządku rosnącym, to: 2, 2,4, 2,6, 2,6, 2,8, 3, 3, 3,2, 3,4, 3,6, 3,8, 4, 4, 4,2, 4,6, 5,2, 6, 6, 6,6, 7,6.

Otrzymujemy teraz z naszej listy próbek bootstrap oznacza przedział ufności. Ponieważ chcemy 90% przedziału ufności, używamy 95. i 5. percentyla jako punktów końcowych przedziałów. Powodem tego jest to, że podzieliliśmy 100% - 90% = 10% na pół, dzięki czemu będziemy mieli środkowe 90% wszystkich środków próbki ładowania początkowego.