Ekstrapolacja i interpolacja są wykorzystywane do oszacowania hipotetycznych wartości zmiennej na podstawie innych obserwacji. Istnieje wiele metod interpolacji i ekstrapolacji opartych na ogólnym trendzie obserwowanym w dane. Te dwie metody mają nazwy bardzo podobne. Zbadamy różnice między nimi.
Prefiksy
Aby odróżnić ekstrapolację od interpolacji, musimy spojrzeć na przedrostki „extra” i „inter”. Prefiks „extra” oznacza „na zewnątrz” lub „oprócz”. Przedrostek „inter” oznacza „pomiędzy” lub „pomiędzy”. Po prostu znając te znaczenia (z ich oryginałów w łacina) w znacznym stopniu rozróżnia te dwie metody.
Ustawienie
W przypadku obu metod zakładamy kilka rzeczy. Zidentyfikowaliśmy zmienną niezależną i zmienną zależną. Przez próbowanie lub zbiór danych, mamy kilka par tych zmiennych. Zakładamy również, że opracowaliśmy model dla naszych danych. To może być linia najmniejszych kwadratów najlepszego dopasowania lub może to być inny rodzaj krzywej zbliżonej do naszych danych. W każdym razie mamy funkcję, która wiąże zmienną niezależną ze zmienną zależną.
Celem jest nie tylko sam model, zazwyczaj chcemy wykorzystać nasz model do przewidywania. Mówiąc dokładniej, biorąc pod uwagę zmienną niezależną, jaka będzie przewidywana wartość odpowiedniej zmiennej zależnej? Wartość, którą wprowadzamy dla naszej niezależnej zmiennej, określa, czy pracujemy z ekstrapolacją, czy interpolacją.
Interpolacja
Przy pomocy naszej funkcji możemy przewidzieć wartość zmiennej zależnej dla zmiennej niezależnej, która znajduje się w środku naszych danych. W takim przypadku wykonujemy interpolację.
Załóżmy, że dane z x od 0 do 10 jest używane do wytworzenia a linia regresjiy = 2x + 5. Możemy użyć tej linii najlepszego dopasowania do oszacowania y wartość odpowiadająca x = 6. Po prostu podłącz tę wartość do naszego równania i zobaczymy y = 2(6) + 5 =17. Ponieważ nasze x wartość należy do zakresu wartości użytych do najlepszego dopasowania linii, jest to przykład interpolacji.
Ekstrapolacja
Przy pomocy naszej funkcji możemy przewidzieć wartość zmiennej zależnej dla zmiennej niezależnej, która jest poza zakresem naszych danych. W takim przypadku przeprowadzamy ekstrapolację.
Załóżmy, jak poprzednio te dane z x od 0 do 10 służy do utworzenia linii regresji y = 2x + 5. Możemy użyć tej linii najlepszego dopasowania do oszacowania y wartość odpowiadająca x = 20. Po prostu podłącz tę wartość do naszego równania i zobaczymy y = 2(20) + 5 =45. Ponieważ nasze x wartość nie należy do zakresu wartości użytych do uzyskania linii najlepszego dopasowania, jest to przykład ekstrapolacji.
Uwaga
Spośród dwóch metod preferowana jest interpolacja. Wynika to z faktu, że istnieje większe prawdopodobieństwo otrzymania prawidłowego oszacowania. Korzystając z ekstrapolacji, przyjmujemy, że nasz obserwowany trend utrzymuje się dla wartości x poza zakresem, w którym tworzyliśmy nasz model. To może nie być przypadek, dlatego musimy zachować szczególną ostrożność, stosując techniki ekstrapolacji.