Questo sito utilizza cookie di terze parti per inviarti pubblicità in linea con le tue preferenze. Se vuoi saperne di più clicca QUI 
Chiudendo questo banner, scorrendo questa pagina, cliccando su un link o proseguendo la navigazione in altra maniera, acconsenti all'uso dei cookie. OK

Item Response Theory e disegni non bilanciati

In questo lavoro verranno presentati gli aspetti fondamentali della Item Response Theory: uno dei principali e più moderni metodi per il trattamento di dati ottenuti dai test di apprendimento (achievement test). In particolare, saranno considerati due aspetti che coinvolgono problematiche di tipo statistico: la fase della costruzione del test (item calibration) nella quale è necessario valutare se le domande (item) introdotte e le risposte previste sono idonee a “misurare” le competenze (o abilità latenti) apprese dal soggetto; la fase della quantificazione dell’abilità latente individuale e di gruppo. Verranno pertanto presentati i principali modelli statistici che permettono di specificare la relazione tra le caratteristiche dell’item e l’abilità del soggetto, in modo da poter prevedere probabilisticamente la risposta corretta all’item (Item Response Function): il modello di Rasch (One-Parameter Logistic Model), i modelli di Birnbaum (Two-Three-Parameter Logistic Model) e ulteriori approfondimenti, nonché le principali metodologie statistiche che consentono di ricavare le stime congiunte dei parametri di tali modelli. Si presta inoltre particolare attenzione all’approccio Bayesiano, assegnando al vettore delle abilità latenti una distribuzione di probabilità nota a priori. Verrà infine trattato il caso in cui i soggetti potrebbero non rispondere a tutti gli item nel test ma soltanto ad un numero limitato, condizionatamente alla loro abilità latente (attrition).

La Item Response Theory si sviluppa agli inizi del 1900 a seguito della Classical Test Theory e, a partire dal 1960, viene perfezionata e approfondita collocandosi prevalentemente nella tradizione della teoria dei test educativi e psicometrici (educational testing). Oggigiorno, la IRT è comunemente utilizzata dalle più grandi compagnie, industrie e istituti di ricerca negli Stati Uniti e in Europa per la progettazione, assemblaggio e calibratura dei test in quanto prevede una metodologia estremamente potente e flessibile in grado di fornire soluzioni adeguate ai problemi di misura e di valutazione.

Mostra/Nascondi contenuto.
ITEM RESPONSE THEORY 1) Introduzione La valutazione dell’efficacia dei processi formativi e di molte altre attività umane (quali per esempio: sport, istruzione, ricerca, formazione professionale, ed altre attività comportamentali definite nell’ambito educativo e psicologico) rappresenta un problema di notevole interesse statistico in quanto tali aspetti non sono direttamente misurabili. Lo strumento maggiormente utilizzato in tali ambiti valutativi è quello del test di apprendimento (o achievement test), che è costituito da una scheda contenente una batteria di domande (item) a risposta generalmente chiusa riguardanti diversi argomenti, quali ad esempio: argomenti di cultura generale, problemi logico-matematici, ecc.. L’obiettivo del test è quello di misurare il livello di rendimento generale del soggetto nella prova. Preliminarmente a tale misurazione si pone anche un problema di calibratura del test, che non deve contenere domande inefficaci al fine della misurazione. La calibratura del test e la misurazione delle capacità coinvolgono due vaste aree metodologiche: la Classical Test Theory (CTT) e la Item Response Theory (IRT). Entrambe le metodologie hanno come obiettivo principale quello di classificare le “performance” di un soggetto lungo una dimensione latente, non direttamente osservabile. La CTT fu originariamente la struttura principale per le analisi e la costruzione di test standardizzati; questa teoria si sviluppò pressappoco dal 1920 e viene denominata anche come “true score theory” perché si basa sull’assunzione fondamentale che un soggetto che si sottopone ad un test ottiene un certo “punteggio osservato” ed un “punteggio teorico”. Con il termine “punteggio” si vuole intendere il numero di risposte esatte fornite da un soggetto. Il punteggio osservato è una stima del punteggio “vero” più o meno una componente accidentale non osservabile (errore casuale). Uno dei problemi più noti di tale teoria è che le caratteristiche dei soggetti e quelle del test non possono essere separate ma devono essere interpretate congiuntamente. L’abilità di un soggetto è definita solo da quel particolare test e dipende esclusivamente dal punteggio ottenuto, mentre la difficoltà di un item è ottenuta dalla proporzione di soggetti che hanno risposto correttamente all’item rispetto al totale degli stessi. Perciò se un item è “facile” o “difficile” dipende dall’abilità dei soggetti e le abilità dei soggetti dipendono dalla difficoltà degli item stessi! Risulta perciò davvero difficile riuscire a confrontare le abilità di soggetti che si sottopongono a diversi test e confrontare le caratteristiche degli item di un test somministrato a gruppi di soggetti differenti tra loro. 3

Laurea liv.I

Facoltà: Scienze Statistiche

Autore: Andrea Fontana Contatta »

Composta da 43 pagine.

 

Questa tesi ha raggiunto 2602 click dal 19/12/2006.

 

Consultata integralmente 3 volte.

Disponibile in PDF, la consultazione è esclusivamente in formato digitale.