Teoria Clasica a Testarii (CTT)

02 Iul 2013

Anne Anastasi,cunoscuta sub numele „Gurul Testarii Psihologice”, a fost probabil una dintre persoanele careia trebuie sa-i fim recunoscatori pentru ca in prezent avem teste si chestionare psihologice. Acest material se concentreaza pe Teoria Clasica a Testarii, cea care inca guverneaza o multitudine de instrumente psihometrice.

O persoana poate avea rezultate diferite la acelasi test in situatii diferite de testare. Scorurile pot fi ridicate sau scazute ca urmare a unor influente sistematice (exercitiul si transferul de efect) sau influente nesistematice (oboseala, influente externe).

Pentru a explica fenomenul de a avea un scor diferit cu ocazii diferite de testare, asumptia Teoriei Clasice a Testarii este aceea ca rezultatul testului reflecta nivelul real al caracteristicii investigate, dar include si o eroare aleatorie. Mai mult, aceasta premisa este cunoscuta ca teoria erorii de masurare.

Urmatoarele exemple au rolul de a ilustreaza acest proces si de a exemplifica rationamentul din spatele Teoriei Clasice a Testarii:

Exemplul 1: Sa presupunem ca un profesor calculeaza notele elevilor pe baza rezultatelor de la sase teste de matematica. Exercitiile utilizate intr-un test au dificultati variate. Cel mai bun elev reuseste sa rezolve chiar si cel mai dificil exercitiu. Totusi, performanta elevului - care poate sa rezolve toate exercitiile - variaza intre teste si intre exercitiile individuale din teste. Aceasta variatie poate sa apara din cauza unor influente interne nesistematice (de ex: motivatie, oboseala) sau influente externe (de ex: zgomote), iar acestea afecteaza rezultatele elevului. Astfel, intr-un test cu un singur exercitiu este posibil ca un elev cu un nivel general de performanta mai slab sa aiba rezultate mai bune fata de cel mai bun elev datorita sansei de a raspunde corect la acel exercitiu. Prin urmare, conform teoriei clasice a testarii, este mai utila efectuarea unor masurari multiple. Folosind teste diferite, fiecare avand un numar mai mare de itemi, este posibil sa stabilim nivelul real de performanta al elevului, in modul acesta influentele erorilor fiind estompate.

Exemplul 2: Intr-o competitie de sarituri in inaltime, scopul este de a masura abilitatea atletului de a sari in inaltime. Atletilor le sunt prezentate inaltimi de dificultate diferita, iar acestia au trei incercari la fiecare proba. Cu cat creste inaltimea, cu atat le este mai greu atletilor sa aiba o saritura peste bara. Castigatorul este acela ce rezolva cel mai dificil item – in cazul acesta acela ce are cea mai inalta saritura. Chiar daca conditiile (de exemplu vremea este constanta) sunt aceleasi pentru fiecare saritura, performanta unui atlet va varia. Aceasta variatie poate fi din cauza unor influente interne nesistematice (de ex: motivatie, oboseala) sau influente externe (de ex: o rafala de vant), iar acestea distorsioneaza rezultatele. Daca in evaluarea atletilor, se ia in calcul o singura saritura, atunci este posibil ca un atlet cu abilitati reale mai slabe sa castige impotriva unui atlet cu abilitati reale mai dezvoltate. In termenii teoriei clasice a testarii, acest exemplu arata care este logica utilizarii mai multor probe de sarit (itemi), de inaltimi diferite (dificultate) pentru a evalua abilitatea “reala” a unui atlet. Astfel, influentele aleatorii ale erorilor sunt eliminate prin medie datorita masurarii repetate.

Obiectivul unei masurari este acela de a separa elementul de eroare de nivelul real al trasaturii, in scopul de a identifica cea mai exacta estimare/predictie posibila. Teoretic, aceasta se poate indeplini prin administrarea repetata a unui test. Atunci media masurarilor ar corespunde cu nivelul real al trasaturii si astfel ar fi eliminata eroarea aleatorie. Deoarece administrarea repetata ar fi improbabila din motive economice, putand aparea efectul invatarii, atunci repetarea masurarii se desfasoara in cadrul testului prin administrarea de itemi multiplii.

Dearece obiectivul CTT este de a separa eroarea de masurarare fata de scorul real, un aspect important este precizia sau acuratetea unui test. (= Fidelitatea).

Exemplu: Un test de rationament inductiv este considerat fidel daca clasamentul respondentilor la abilitatea de a rationa inductiv poate fi replicat in forma identica dupa fiecare repetare a testului.

Pentru a determina fidelitatea unui test si a estima nivelul real al trasaturi masurate, CTT descrie o serie de axiome:

Axioma de baza: Scorul observat al unui respondent este compus din scorul real (nivelul adevarat al caracteristicii) plus o eroare. Scor Observat = Scor Real + Eroare
Eroarea este o variabila aleatorie cu o valoare asteptata de zero si cu o variatie finita. Cu alte cuvinte: eroarea de masurara este eliminata prin media masuratorilor infinite a unui individ sau a populatiei.
Nu exista o corelatie intre eroarea de masurare si scorul real, deoarece scorul real al unui respondent este constant. O constanta nu are varianta, prin urmare nu poate fi corelata cu o eroare ce variaza de la o masurare la alta.
Eroarea de masurare a unui test nu este asociata unui scor real din alt test, deci nu este asociata rezultatelor altor investigatii.
Nu exista corelatii intre eroarea de masurare a unui test si eroarea de masurare a altui test.

Argumente suplimentare emise de CTT se refera la obiectivitatea si validitatea testelor.

Critici aduse CTT:
Desi CTT este baza majoritatii testelor utilizate in ziua de astazi, aceasta nu este lipsita de critici. Criticile se datoreaza, in parte, din cauza faptului ca buna parte a axiomelor sunt inferente matematice care sunt corecte logic, cu conditia ca definitiile de scor real si eroare sa fie valide. Dar, din moment ce acestea nu sunt observabile, chiar si axioma de baza a CTT nu poate fi demonstrata empiric. In plus, estimarile nivelului de eroare sunt calculate in baza scorurilor obtinute pe esantioane de respondenti – deci acestea sunt dependente de esantion. Depinzand de esantionul utilizat, parametrii unui item (dificultatea unui item) poate sa fie schimbata. Aceasta implica ideea ca pana si fidelitatea este dependenta de esantionul utilizat si nu reprezinta o proprietate stricta a testului.

Mai mult, CTT este in mod pur o teorie a erorii de masurare ce se preocupa doar de elementele formale ale unui scor observat intr-un test. CTT nu ofera informatii despre cum a raspuns participantul la itemii sau cum a fost obtinuta performanta acestuia.