Bootstrapping to technika statystyczna, która mieści się w szerszym zakresie ponownego próbkowania. Ta technika wymaga stosunkowo prostej procedury, ale powtarzanej tyle razy, że w dużym stopniu zależy od obliczeń komputerowych. Bootstrapping zapewnia metodę inną niż przedziały ufności w celu oszacowania parametru populacji. Rozruch bardzo przypomina działanie magii. Czytaj dalej, aby zobaczyć, w jaki sposób uzyskuje swoją interesującą nazwę.
Wyjaśnienie ładowania początkowego
Jeden cel wnioskowanie statystyczne jest określenie wartości parametru populacji. Bezpośredni pomiar jest zazwyczaj zbyt drogi lub nawet niemożliwy. Więc korzystamy próbkowanie statystyczne. Próbkujemy populację, mierzymy statystyki tej próbki, a następnie używamy tej statystyki, aby powiedzieć coś o odpowiedni parametr populacji.
Na przykład w fabryce czekolady możemy chcieć zagwarantować, że batoniki mają coś szczególnego oznaczać waga. Ważenie każdego wyprodukowanego batonika jest niewykonalne, dlatego używamy technik próbkowania, aby losowo wybierać 100 batonów. Obliczamy średnią z tych 100 batonów i stwierdzamy, że średnia populacji mieści się w marginesie błędu w stosunku do średniej z naszej próbki.
Załóżmy, że kilka miesięcy później chcemy wiedzieć z większą dokładnością - lub mniej margines błędu - jaka była średnia waga batonika w dniu, w którym próbowaliśmy linię produkcyjną. Nie możemy również używać dzisiejszych batonów wiele zmiennych weszli na zdjęcie (różne partie mleka, cukru i ziaren kakaowych, różne warunki atmosferyczne, różni pracownicy na linii itp.). Wszystko, co mamy od dnia, który nas ciekawi, to 100 wag. Bez maszyny czasu w tamtych czasach wydawałoby się, że początkowy margines błędu jest najlepszy, na jaki możemy liczyć.
Na szczęście możemy użyć technika ładowania początkowego. W tej sytuacji losowo próbka z zamiennikiem ze 100 znanych wag. Następnie nazywamy to próbką ładowania początkowego. Ponieważ zezwalamy na wymianę, ta próbka ładowania początkowego najprawdopodobniej nie jest identyczna z naszą próbką początkową. Niektóre punkty danych mogą być powielone, a inne punkty danych z początkowej 100 mogą zostać pominięte w próbce ładowania początkowego. Za pomocą komputera tysiące próbek ładujących można zbudować w stosunkowo krótkim czasie.
Przykład
Jak wspomniano, aby naprawdę korzystać z technik ładowania początkowego, musimy korzystać z komputera. Poniższy przykład liczbowy pomoże zademonstrować, jak działa proces. Jeśli zaczniemy od próbki 2, 4, 5, 6, 6, wówczas możliwe są wszystkie następujące próbki bootstrap:
- 2 ,5, 5, 6, 6
- 4, 5, 6, 6, 6
- 2, 2, 4, 5, 5
- 2, 2, 2, 4, 6
- 2, 2, 2, 2, 2
- 4,6, 6, 6, 6
Historia techniki
Techniki bootstrap są stosunkowo nowe w dziedzinie statystyki. Pierwsze zastosowanie zostało opublikowane w artykule z 1979 r. Autorstwa Bradleya Efrona. Ponieważ moc obliczeniowa wzrosła i staje się tańsza, techniki ładowania początkowego stały się bardziej rozpowszechnione.
Dlaczego ładowanie nazwy?
Nazwa „bootstrapping” pochodzi od frazy: „Podnieść się za pasek bootstrap”. Odnosi się to do niedorzeczności i niemożliwości. Staraj się, jak możesz, nie możesz wznieść się w powietrze, ciągnąc za kawałki skóry na butach.
Istnieje pewna teoria matematyczna uzasadniająca techniki ładowania początkowego. Jednak użycie ładowania początkowego sprawia wrażenie niemożliwego. Chociaż nie wydaje się, aby można było poprawić szacunek statystyki populacji poprzez ponowne użycie tej samej próbki w kółko, w rzeczywistości można to zrobić.