Główne składniki i analiza czynnikowa

Analiza głównych składników (PCA) i analiza czynnikowa (FA) to techniki statystyczne stosowane do redukcji danych lub wykrywania struktury. Te dwie metody są stosowane do jednego zestawu zmiennych, gdy badacz jest zainteresowany odkrywanie, które zmienne w zestawie tworzą spójne podzestawy, które są względnie niezależne od jednego inne. Zmienne, które są ze sobą skorelowane, ale są w dużej mierze niezależne od innych zbiorów zmiennych, są łączone w czynniki. Czynniki te pozwalają na zagęszczenie liczby zmiennych w analizie poprzez połączenie kilku zmiennych w jeden czynnik.

Konkretnymi celami PCA lub FA są podsumowanie wzorców korelacje wśród obserwowanych zmiennych, aby zredukować dużą liczbę obserwowanych zmiennych do mniejszej liczby czynników, aby zapewnić równanie regresji dla bazowego procesu za pomocą obserwowanych zmiennych lub w celu przetestowania teorii na temat natury podstawowych procesów.

Przykład

Powiedzmy na przykład, że badacz jest zainteresowany badaniem cech doktorantów. Badacz bada dużą próbę doktorantów na temat cech osobowości, takich jak motywacja, zdolności intelektualne, historia scholastyczna, historia rodziny, zdrowie, cechy fizyczne, itp. Każdy z tych obszarów mierzy się kilkoma zmiennymi. Zmienne są następnie wprowadzane do analizy indywidualnie i badane są korelacje między nimi. Analiza ujawnia wzorce korelacji między zmiennymi, które, jak się uważa, odzwierciedlają leżące u ich podstaw procesy wpływające na zachowania doktorantów. Na przykład kilka zmiennych z miary zdolności intelektualnej łączy się z niektórymi zmiennymi z miary historii scholastycznej, tworząc czynnik mierzący inteligencję. Podobnie zmienne z miary osobowości mogą łączyć się z niektórymi zmiennymi z motywacji i scholastyki miary historii tworzą czynnik mierzący stopień, w jakim student woli pracować niezależnie - niezależność czynnik.

instagram viewer

Etapy analizy głównych składników i analizy czynnikowej

Etapy analizy głównych składników i analizy czynnikowej obejmują:

  • Wybierz i zmierz zestaw zmiennych.
  • Przygotuj macierz korelacji do wykonania PCA lub FA.
  • Wyodrębnij zestaw czynników z macierzy korelacji.
  • Określ liczbę czynników.
  • W razie potrzeby obróć czynniki, aby zwiększyć interpretowalność.
  • Interpretuj wyniki.
  • Sprawdź strukturę czynników, ustalając poprawność konstrukcji czynników.

Różnica między analizą głównych składników a analizą czynnikową

Analiza głównych składników i analiza czynnikowa są podobne, ponieważ obie procedury są stosowane w celu uproszczenia struktury zestawu zmiennych. Analizy różnią się jednak na kilka ważnych sposobów:

  • W PCA składniki są obliczane jako liniowe kombinacje pierwotnych zmiennych. W FA oryginalne zmienne są zdefiniowane jako liniowe kombinacje czynników.
  • W PCA celem jest uwzględnienie jak największej części całości zmienność w zmiennych, jak to możliwe. Celem w FA jest wyjaśnienie kowariancji lub korelacji między zmiennymi.
  • PCA służy do zmniejszenia danych na mniejszą liczbę składników. FA służy do zrozumienia, jakie konstrukcje leżą u podstaw danych.

Problemy z analizą głównych składników i analizą czynnikową

Jednym problemem z PCA i FA jest to, że nie ma zmiennej kryterium, według której można by przetestować rozwiązanie. W innych technikach statystycznych, takich jak analiza funkcji dyskryminacyjnej, regresja logistyczna, analiza profilu i wielowymiarowa analiza wariancji, rozwiązanie ocenia się na podstawie tego, jak dobrze przewiduje członkostwo w grupie. W PCA i FA nie ma zewnętrznego kryterium, takiego jak członkostwo w grupie, na podstawie którego można by przetestować rozwiązanie.

Drugi problem PCA i FA polega na tym, że po ekstrakcji dostępna jest nieskończona liczba obrotów, wszystkie uwzględniają tę samą ilość wariancji w oryginalnych danych, ale z nieznacznie zdefiniowanym współczynnikiem różne. Ostateczny wybór należy do naukowca na podstawie oceny jego interpretowalności i przydatności naukowej. Naukowcy często różnią się opinią, który wybór jest najlepszy.

Trzecim problemem jest to, że FA jest często używane do „ratowania” źle pomyślanych badań. Jeżeli żadna inna procedura statystyczna nie jest odpowiednia ani obowiązująca, dane można przynajmniej przeanalizować czynnikowo. To sprawia, że ​​wielu uważa, że ​​różne formy FA są związane z niechlujnymi badaniami.

instagram story viewer