Skalowane wyniki są rodzajem wyniku egzaminu. Są one powszechnie używane przez firmy testujące, które przeprowadzają egzaminy na wysokie stawki, takie jak wstępy, orzecznictwo oraz egzaminy licencyjne. Skalowane wyniki są również wykorzystywane do testowania K-12 Common Core i innych egzaminów, które oceniają umiejętności uczniów i oceniają postępy w nauce.
Surowe wyniki vs. Skalowane wyniki
Pierwszym krokiem do zrozumienia skalowanych wyników jest poznanie różnic między wynikami surowymi. Surowy wynik reprezentuje liczbę pytań egzaminacyjnych, na które poprawnie odpowiesz. Na przykład, jeśli egzamin zawiera 100 pytań i otrzymujesz 80 z nich poprawnie, Twój wynik surowy to 80. Twój poprawny procentowo wynik, który jest rodzajem surowego wyniku, wynosi 80%, a twój stopień jest B-.
Skalowany wynik jest wynikiem surowym, który został dostosowany i przekonwertowany na standardową skalę. Jeśli Twój wynik surowy to 80 (ponieważ masz 80 ze 100 poprawnych pytań), wynik ten jest korygowany i przekształcany w wynik skalowany. Surowe wyniki można konwertować liniowo lub nieliniowo.
Przykład wyniku skalowanego
The DZIAŁAĆ jest przykładem egzaminu wykorzystującego transformację liniową do konwersji wyników surowych na wyniki skalowane. Poniższy wykres konwersacji pokazuje, jak surowe wyniki z każdej sekcji ACT są przekształcane w skalowane wyniki.
Surowy wynik w języku angielskim | Surowy wynik matematyki | Czytanie wyniku surowego | Surowy wynik nauki | Skalowany wynik |
---|---|---|---|---|
75 | 60 | 40 | 40 | 36 |
72-74 | 58-59 | 39 | 39 | 35 |
71 | 57 | 38 | 38 | 34 |
70 | 55-56 | 37 | 37 | 33 |
68-69 | 54 | 35-36 | - | 32 |
67 | 52-53 | 34 | 36 | 31 |
66 | 50-51 | 33 | 35 | 30 |
65 | 48-49 | 32 | 34 | 29 |
63-64 | 45-47 | 31 | 33 | 28 |
62 | 43-44 | 30 | 32 | 27 |
60-61 | 40-42 | 29 | 30-31 | 26 |
58-59 | 38-39 | 28 | 28-29 | 25 |
56-57 | 36-37 | 27 | 26-27 | 24 |
53-55 | 34-35 | 25-26 | 24-25 | 23 |
51-52 | 32-33 | 24 | 22-23 | 22 |
48-50 | 30-31 | 22-23 | 21 | 21 |
45-47 | 29 | 21 | 19-20 | 20 |
43-44 | 27-28 | 19-20 | 17-18 | 19 |
41-42 | 24-26 | 18 | 16 | 18 |
39-40 | 21-23 | 17 | 14-15 | 17 |
36-38 | 17-20 | 15-16 | 13 | 16 |
32-35 | 13-16 |
14 | 12 | 15 |
29-31 | 11-12 | 12-13 | 11 | 14 |
27-28 | 8-10 | 11 | 10 | 13 |
25-26 | 7 | 9-10 | 9 | 12 |
23-24 | 5-6 | 8 | 8 | 11 |
20-22 | 4 | 6-7 | 7 | 10 |
18-19 | - | - | 5-6 | 9 |
15-17 | 3 | 5 | - | 8 |
12-14 | - | 4 | 4 | 7 |
10-11 | 2 | 3 | 3 | 6 |
8-9 | - | - | 2 | 5 |
6-7 | 1 | 2 | - | 4 |
4-5 | - | - | 1 | 3 |
2-3 | - | 1 | - | 2 |
0-1 | 0 | 0 | 0 | 1 |
Proces zrównania
Proces skalowania tworzy skalę podstawową, która służy jako odniesienie dla innego procesu znanego jako zrównanie. Proces zrównania jest konieczny, aby uwzględnić różnice między wieloma wersjami tego samego testu.
Chociaż twórcy testów starają się utrzymać poziom trudności testu taki sam w poszczególnych wersjach, różnice są nieuniknione. Zrównanie pozwala twórcy testu na statystyczną korektę wyników, tak aby średnia wydajność w wersji jeden z testów jest równy średniej wydajności w drugiej wersji testu, w trzeciej wersji testu i tak dalej na.
Po przejściu zarówno skalowania, jak i zrównania, skalowane wyniki powinny być wymienne i łatwo porównywalne bez względu na to, która wersja testu została podjęta.
Przykład zrównania
Spójrzmy na przykład, aby zobaczyć, w jaki sposób proces zrównania może wpływać na skalowane wyniki w standardowych testach. Wyobraź sobie, że mówisz, że ty i przyjaciel bierzecie SAT. Obaj przystępujecie do egzaminu w tym samym centrum egzaminacyjnym, ale przystępujecie do testu w styczniu, a kolega podejmie test w lutym. Masz różne daty testów i nie ma gwarancji, że obaj weźmiesz tę samą wersję SAT. Możesz zobaczyć jedną formę testu, podczas gdy twój przyjaciel widzi inną. Chociaż oba testy mają podobną treść, pytania nie są dokładnie takie same.
Po wzięciu SAT, ty i twój przyjaciel spotykacie się i porównujecie swoje wyniki. Oboje macie surowy wynik 50 w sekcji matematycznej, ale wasz skalowany wynik to 710, a skalowany wynik twojego przyjaciela to 700. Twój kumpel zastanawia się, co się stało, odkąd obaj otrzymali taką samą liczbę pytań. Ale wyjaśnienie jest dość proste; każdy z was podjął inną wersję testu, a wasza wersja była trudniejsza niż jego. Aby uzyskać ten sam skalowany wynik na SAT, musiałby odpowiedzieć poprawnie na więcej pytań niż ty.
Twórcy testów używający procesu zrównania używają innej formuły, aby stworzyć unikalną skalę dla każdej wersji egzaminu. Oznacza to, że nie ma jednej tabeli konwersji wyniku surowego na skalę, której można użyć dla każdej wersji egzaminu. Dlatego w naszym poprzednim przykładzie surowy wynik 50 został przeliczony na 710 jednego dnia i 700 na inny dzień. Miej to na uwadze, biorąc udział w testach ćwiczeniowych i korzystając z tabel konwersji, aby przekształcić swój wynik surowy w wynik skalowany.
Cel skalowanych wyników
Wyniki surowe są zdecydowanie łatwiejsze do obliczenia niż wyniki skalowane. Ale firmy testujące chcą się upewnić, że wyniki testów mogą być rzetelnie i dokładnie porównane, nawet jeśli osoby testujące przyjmują różne wersje lub formy testu w różnych terminach. Skalowane wyniki pozwalają na dokładne porównania i zapewniają, że osoby, które wykonały trudniejszy test, nie zostaną ukarane, a osobom, które przystąpiły do trudniejszego testu, nie przyznaje się nieuczciwej przewagi.