021 310 54 57
consulting@hart.ro

Teoria Clasica a Testarii (CTT)

02 Iul 2013

Anne Anastasi,cunoscuta sub numele „Gurul Testarii Psihologice”, a fost probabil una dintre persoanele careia trebuie sa-i fim recunoscatori pentru ca in prezent avem teste si chestionare psihologice. Acest material se concentreaza pe Teoria Clasica a Testarii, cea care inca guverneaza o multitudine de instrumente psihometrice.

O persoana poate avea rezultate diferite la acelasi test in situatii diferite de testare. Scorurile pot fi ridicate sau scazute ca urmare a unor influente sistematice (exercitiul si transferul de efect) sau influente nesistematice (oboseala, influente externe).

Pentru a explica fenomenul de a avea un scor diferit cu ocazii diferite de testare, asumptia Teoriei Clasice a Testarii este aceea ca rezultatul testului reflecta nivelul real al caracteristicii investigate, dar include si o eroare aleatorie. Mai mult, aceasta premisa este cunoscuta ca teoria erorii de masurare. 

Urmatoarele exemple au rolul de a ilustreaza acest proces si de a exemplifica rationamentul din spatele Teoriei Clasice a Testarii:

Exemplul  1: Sa presupunem ca un profesor calculeaza notele elevilor pe baza rezultatelor de la sase teste de matematica. Exercitiile utilizate intr-un test au dificultati variate. Cel mai bun elev reuseste sa rezolve chiar si cel mai dificil exercitiu. Totusi, performanta elevului - care poate sa rezolve toate exercitiile - variaza intre teste si intre exercitiile individuale din teste. Aceasta variatie poate sa apara din cauza unor influente interne nesistematice (de ex: motivatie, oboseala) sau influente externe (de ex: zgomote), iar acestea afecteaza rezultatele elevului. Astfel, intr-un test cu un singur exercitiu este posibil ca un elev cu un nivel general de performanta mai slab sa aiba rezultate mai bune fata de cel mai bun elev datorita sansei de a raspunde corect la acel exercitiu. Prin urmare, conform teoriei clasice a testarii, este mai utila efectuarea unor masurari multiple. Folosind teste diferite, fiecare avand un numar mai mare de itemi, este posibil sa stabilim nivelul real de performanta al elevului, in modul acesta influentele erorilor fiind estompate.

Exemplul 2: Intr-o competitie de sarituri in inaltime, scopul este de a masura abilitatea atletului de a sari in inaltime. Atletilor le sunt prezentate inaltimi de dificultate diferita, iar acestia au trei incercari la fiecare proba. Cu cat creste inaltimea, cu atat le este mai greu atletilor sa aiba o saritura peste bara. Castigatorul este acela ce rezolva cel mai dificil item – in cazul acesta acela ce are cea mai inalta saritura. Chiar daca conditiile (de exemplu vremea este constanta) sunt aceleasi pentru fiecare saritura, performanta unui atlet va varia. Aceasta variatie poate fi din cauza unor influente interne nesistematice (de ex: motivatie, oboseala) sau influente externe (de ex: o rafala de vant), iar acestea distorsioneaza rezultatele. Daca in evaluarea atletilor, se ia in calcul o singura saritura, atunci este posibil ca un atlet cu abilitati reale mai slabe sa castige impotriva unui atlet cu abilitati reale mai dezvoltate. In termenii teoriei clasice a testarii, acest exemplu arata care este logica utilizarii mai multor probe de sarit (itemi), de inaltimi diferite (dificultate) pentru a evalua abilitatea “reala” a unui atlet. Astfel, influentele aleatorii ale erorilor sunt eliminate prin medie datorita masurarii repetate.

Obiectivul unei masurari este acela de  a separa elementul de eroare de  nivelul real al trasaturii, in scopul de a identifica cea mai exacta estimare/predictie posibila. Teoretic, aceasta se poate indeplini prin administrarea repetata a unui test. Atunci media masurarilor ar corespunde cu nivelul real al trasaturii si astfel ar fi eliminata eroarea aleatorie. Deoarece administrarea repetata ar fi improbabila din motive economice, putand aparea efectul invatarii, atunci repetarea masurarii se desfasoara in cadrul testului prin administrarea de itemi multiplii.

Dearece obiectivul CTT este de a separa eroarea de masurarare fata de scorul real, un aspect important este precizia sau acuratetea unui test. (= Fidelitatea).

Exemplu: Un test de rationament inductiv este considerat fidel daca clasamentul respondentilor la abilitatea de a rationa inductiv poate fi replicat in forma identica dupa fiecare repetare a testului.

Pentru a determina fidelitatea unui test si a estima nivelul real al trasaturi masurate, CTT descrie o serie de axiome:

  • Axioma de baza: Scorul observat al unui respondent este compus din scorul real (nivelul adevarat al caracteristicii) plus o eroare. Scor Observat = Scor Real + Eroare
  • Eroarea este o variabila aleatorie cu o valoare asteptata de zero si cu o variatie finita. Cu alte cuvinte: eroarea de masurara este eliminata prin media masuratorilor infinite a unui individ sau a populatiei.
  • Nu exista o corelatie intre eroarea de masurare si scorul real, deoarece scorul real al unui respondent este constant. O constanta nu are varianta, prin urmare nu poate fi corelata cu o eroare ce variaza de la o masurare la alta.
  • Eroarea de masurare a unui test nu este asociata unui scor real din alt test, deci nu este asociata rezultatelor altor investigatii.
  • Nu exista corelatii intre eroarea de masurare a unui test si eroarea de masurare a altui test.

Argumente suplimentare emise de CTT se refera la obiectivitatea si validitatea testelor.

Critici aduse CTT:
Desi CTT este baza majoritatii testelor utilizate in ziua de astazi, aceasta nu este lipsita de critici. Criticile se datoreaza, in parte, din cauza faptului ca buna parte a axiomelor sunt inferente matematice care sunt corecte logic, cu conditia ca definitiile de scor real si eroare sa fie valide. Dar, din moment ce acestea nu sunt observabile, chiar si axioma de baza a CTT nu poate fi demonstrata empiric. In plus, estimarile nivelului de eroare sunt calculate in baza scorurilor obtinute pe esantioane de respondenti – deci acestea sunt dependente de esantion. Depinzand de esantionul utilizat, parametrii unui item (dificultatea unui item) poate sa fie schimbata. Aceasta implica ideea ca pana si fidelitatea este dependenta de esantionul utilizat si nu reprezinta o proprietate stricta a testului.

Mai mult, CTT este in mod pur o teorie a erorii de masurare ce se preocupa doar de elementele formale ale unui scor observat intr-un test. CTT nu ofera informatii despre cum a raspuns participantul la itemii sau cum a fost obtinuta performanta acestuia.

Testimoniale
(Roxana Tronaru, BRD - Groupe Societe Generale)
Am lucrat cu echipa de la Hart Consulting pentru dezvoltarea unor exercitii de tip joc de rol - parte integranta din Centrele de Evaluare din cadrul BRD GSG. Consultantii au fost inca de la inceput foarte receptivi la nevoile noastre, am construit impreuna structura proiectului si am comunicat eficient pe tot parcursul acestuia. In cadrul sesiunilor de follow-up, specialistii de la Hart au
(Magdalena Vrajitoru, RBS Romania)
Am elaborat si desfasurat cu HART Consulting mai multe centre de evaluare si dezvoltare intre anii 2007 si 2008. Obiectivele acestor proiecte au fost: Evaluarea competentelor manageriale pentru angajatii din banci si retail. Selectia pentru avansarea in cariera. HART Consulting utilizeaza diferite exercitii personalizate, adaptate fiecarui profil de competente. HART a efectuat trainingul
(Mircea Vlastean, Henkel Romania)
Cursul iti deschide perspectiva cunoasterii proprii in sensul in care te provoaca sa faci lucruri noi sau intr-un mod diferit, te invata sa stii sa asculti pentru a-l intelege pe celalalt. Te ajuta sa structurezi etapele de coaching si sa-l provoci pe celalalt sa plece cu un rezultat, dar si cu pasii pe care trebuie sa ii urmeze pentru a-si atinge obiectivul in timpul dorit. Mircea Vlastean,
Tu socializezi cu Hart?
Facebook Hart Consulting Twitter Hart Consulting LinkedIn Hart Consulting YouTube Hart Consulting