Wtórna analiza danych to analiza danych zebranych przez kogoś innego. Poniżej omówimy definicję danych wtórnych, sposób ich wykorzystania przez naukowców oraz zalety i wady tego rodzaju badań.
Najważniejsze informacje: Analiza danych wtórnych
- Dane pierwotne odnoszą się do danych zebranych przez badaczy, natomiast dane wtórne odnoszą się do danych zebranych przez kogoś innego.
- Dane wtórne są dostępne z różnych źródeł, takich jak rządy i instytucje badawcze.
- Chociaż korzystanie z danych wtórnych może być bardziej ekonomiczne, istniejące zestawy danych mogą nie odpowiadać na wszystkie pytania badacza.
Porównanie pierwotnych i wtórnych danych
W badaniach nauk społecznych pojęcia pierwotne i wtórne są powszechnie używane. Dane pierwotne są gromadzone przez badacza lub zespół badaczy do określonego celu lub rozważanej analizy. Tutaj zespół badawczy opracowuje i rozwija projekt badawczy, decyduje o technika pobierania próbek, zbiera dane zaprojektowane w celu odpowiedzi na konkretne pytania i przeprowadza własne analizy zebranych danych. W takim przypadku osoby zaangażowane w analizę danych znają projektowanie badań i proces gromadzenia danych.
Analiza danych wtórnych, z drugiej strony jest wykorzystanie danych, które został zebrany przez kogoś innego w innym celu. W takim przypadku badacz stawia pytania, które są rozwiązywane przez analizę zestawu danych, których nie uczestniczyli w gromadzeniu. Dane nie zostały zebrane, aby odpowiedzieć na szczegółowe pytania badawcze badacza, a zamiast tego zostały zebrane w innym celu. Oznacza to, że ten sam zestaw danych może być pierwotnym zestawem danych dla jednego badacza, a drugim zestawem danych dla innego.
Korzystanie z danych wtórnych
Przed użyciem wtórnych danych w analizie należy wykonać kilka ważnych rzeczy. Ponieważ badacz nie zebrał danych, ważne jest, aby zapoznali się z zestawem danych: w jaki sposób dane zostały zebrane, jakie są kategorie odpowiedzi dla każdego pytanie, czy podczas analizy należy stosować wagi, czy należy uwzględnić klastry lub stratyfikacje, kim była populacja badana oraz więcej.
Istnieje wiele wtórnych zasobów danych i zestawów danych dostępne do badań socjologicznych, z których wiele jest publicznych i łatwo dostępnych. The Spis powszechny Stanów Zjednoczonych, Ogólne badanie społecznei Ankieta amerykańskiej społeczności są jednymi z najczęściej używanych dostępnych zestawów danych wtórnych.
Zalety analizy danych wtórnych
Największą zaletą korzystania z danych wtórnych jest to, że mogą być bardziej ekonomiczne. Ktoś inny już zebrał dane, więc badacz nie musi poświęcać pieniędzy, czasu, energii i zasobów na tę fazę badań. Czasami należy zakupić dodatkowy zestaw danych, ale koszt jest prawie zawsze niższy niż koszt zebrania podobnego zbiór danych od zera, który zwykle obejmuje wynagrodzenia, podróże i transport, powierzchnię biurową, sprzęt i inne koszty ogólne koszty Ponadto, ponieważ dane są już gromadzone, zwykle czyszczone i przechowywane w formacie elektronicznym, badacz może spędzać większość czasu analizowanie danych zamiast przygotowywać dane do analizy.
Drugą ważną zaletą korzystania z danych wtórnych jest szerokość dostępnych danych. Rząd federalny prowadzi liczne badania na dużą skalę ogólnokrajową, które trudno byłoby zebrać indywidualnym badaczom. Wiele z tych zestawów danych również wzdłużny, co oznacza, że te same dane zostały zebrane z tej samej populacji w kilku różnych okresach. Pozwala to badaczom przyjrzeć się trendom i zmianom zjawisk w czasie.
Trzecią ważną zaletą korzystania z danych wtórnych jest to, że proces gromadzenia danych często utrzymuje poziom wiedzy specjalistycznej i profesjonalizmu, które mogą nie występować w przypadku indywidualnych badaczy lub małych projektów badawczych. Na przykład gromadzenie danych dla wielu federalnych zestawów danych jest często wykonywane przez specjalizujących się pracowników w niektórych zadaniach i ma wieloletnie doświadczenie w tej konkretnej dziedzinie oraz w tej konkretnej ankiecie. Wiele mniejszych projektów badawczych nie ma takiego poziomu wiedzy specjalistycznej, ponieważ dużo danych jest gromadzonych przez studentów pracujących w niepełnym wymiarze godzin.
Wady analizy danych wtórnych
Główną wadą korzystania z danych wtórnych jest to, że mogą one nie odpowiadać na konkretne pytania badawcze badacza lub zawierać konkretnych informacji, które chciałby mieć badacz. Może również nie zostać zebrany w regionie geograficznym lub w pożądanych latach lub w określonej populacji, którą badacz jest zainteresowany badaniem. Na przykład badacz zainteresowany badaniem nastolatków może stwierdzić, że wtórny zestaw danych obejmuje tylko młodych dorosłych.
Ponadto, ponieważ badacz nie zbierał danych, nie ma kontroli nad zawartością zestawu danych. Często może to ograniczyć analizę lub zmienić oryginalne pytania, na które badacz chciał odpowiedzieć. Na przykład badacz badający szczęście i optymizm może stwierdzić, że wtórny zestaw danych zawiera tylko jeden z nich zmienne, ale nie jedno i drugie.
Powiązanym problemem jest to, że mogły to być zmienne zdefiniowane lub skategoryzowane inaczej niż wybrałby badacz. Na przykład wiek mógł zostać zebrany w kategoriach, a nie jako zmienna ciągła, lub rasa może być zdefiniowana jako „biała” i „inna” zamiast zawierać kategorie dla każdej dużej rasy.
Inną znaczącą wadą korzystania z danych wtórnych jest to, że badacz nie wie dokładnie, jak przebiegał proces zbierania danych ani jak dobrze go przeprowadzono. Badacz zwykle nie ma dostępu do informacji o tym, jak poważnie wpływają na dane problemy, takie jak niski wskaźnik odpowiedzi lub niezrozumienie przez respondenta określonych pytań ankiety. Czasami te informacje są łatwo dostępne, jak ma to miejsce w przypadku wielu federalnych zestawów danych. Jednak wielu innym wtórnym zestawom danych nie towarzyszy ten rodzaj informacji, a analityk musi nauczyć się czytać między wierszami, aby odkryć potencjalne ograniczenia danych.