Resumen 4
Resumen 4
Resumen 4
Matrícula: 21-MPSS-2-118
Sección : 593
Materia : teorías de los test
Profesor: reina selpuveda
Introducción
En este siguiente tema estaremos hablando sobre lo que es el análisis
de reactivos y estandarización de la prueba .
Estos hace referencia a como ellos evalúan y programa el tiempo de la
prueba a realizar , además Este capítulo aborda dos temas en cierta
medida técnicos, pero importantes: el análisis de reac- tivos y la
estandarización de pruebas. Ambos temas tienen que ver con el cálculo
de ciertos aná- lisis estadísticos que deben revisarse con detalle para
determinar si todos los reactivos de una prueba están funcionando como
deberían, y cómo pueden interpretarse las calificaciones de las
pruebas. El análisis de reactivos se centra en el funcionamiento de
reactivos individuales, mientras que la estandarización de pruebas se
ocupa de la interpretación normativa de los resul- tados de la prueba
en su conjunto o de algunas de las partes o subpruebas que la integran.
Desarrollo
• ANÁLISIS DE REACTIVOS
Incluso después de haber sido administrada y calificada una prueba, no siempre es seguro
que haya funcionado bien. Cuando se pilotea una prueba en un principio, es posible que
surjan va- rios problemas. Ésta es una de las razones de que las pruebas que se distribuyen
comercialmen- te se administren primero a una muestra de personas representativas del
grupo que las pruebas están destinadas a medir. Entonces pueden analizarse las respuestas
de esa muestra piloto para determinar si los reactivos están funcionando de manera
adecuada.
Cualquiera que sea el tipo de prueba, estandarizada o elaborada por el maestro, de habili-
dad o de personalidad, un análisis post mortem o post hoc de los resultados es tan necesario
co- mo en medicina o en cualquier otra empresa humana. Entre las preguntas que es preciso
contestar figuran las siguientes: ¿fueron adecuados los límites de tiempo? ¿Los examinados
en- tendieron las instrucciones? ¿Fueron apropiadas las condiciones en que se administró la
prueba? ¿Se manejaron de manera adecuada las situaciones de emergencia? Es inusual que
puedan anti- ciparse todos los problemas o contingencias que surgen durante un piloteo,
pero un análisis pos- terior puede proporcionar información y motivación para prever y
manejar situaciones similares al administrar pruebas en el futuro.
• Análisis de distractores
El análisis de los reactivos de opción múltiple suele empezar con el cálculo de índices de
discri- minación y dificultad para cada reactivo. Un análisis secundario se ocupa del
funcionamiento de los distractores k 1 para cada reactivo. El índice de discriminación de
reactivos (D) propor- ciona cierta información sobre el funcionamiento de los distractores en
conjunto. Un D positivo indica que los examinados en el grupo superior (en la calificación
total de la prueba) tendieron a seleccionar uno de los distractores; la magnitud de D indica la
medida de esta tendencia. Por otra parte, un D negativo indica que los distractores se
eligieron con mayor frecuencia por exa- minados del grupo superior que por los del grupo
inferior y que el reactivo debe revisarse.
• Normas percentilares
Las normas percentilares consisten en una tabla de percentiles que corresponden a
puntuaciones crudas particulares. Las puntuaciones crudas se transforman como percentiles,
y el porcentaje del grupo de norma inferior a una calificación en particular es el rango
percentilar de dicha ca-lificación. Las columnas 2 y 5 de la distribución que aparece en la
tabla 4.2 muestran que, para este grupo de calificaciones, el rango percentilar de una
calificación de 625 es aproximadamen- te 82, y el rango percentilar de una calificación de
475 es aproximadamente 23. Alternativamente, puede decirse que el octagésimo segundo
percentil es 625 y el vigésimo tercero es 475.
• IGUALACIÓN DE PRUEBAS
En muchas situaciones que implican la aplicación y la investigación de pruebas psicológicas,
se requiere más de una versión de prueba. Las formas paralelas de una prueba son
equivalentes en el sentido de que pueden contener los mismos tipos de reactivos de igual
dificultad y que están altamente correlacionadas. Por lo tanto, las calificaciones que se
obtienen en una forma son muy similares a las obtenidas por los mismos examinados en una
segunda forma en el mismo nivel de edad o de grado que la primera forma.
Desafortunadamente, elaborar pruebas paralelas es un proceso bastante caro y laborioso.
Al proceso de igualar, o más bien de hacer comparables, dos pruebas del mismo nivel de
dificultad (por ejemplo, el mismo grado) se le conoce como igualación horizontal. Esto
también puede realizarse verticalmente, como cuando se igualan las calificaciones de dos
pruebas con distintos niveles de dificultad (grados diferentes). En general, el proceso de
igualar incluye su- jetar las pruebas a reactivos comunes o a un banco, como se realizó cada
año con la Prueba de Aptitud Académica (SAT) estadounidense. Al usar un conjunto de
reactivos en común que eran los mismos que un subconjunto de reactivos en por lo menos
una forma anterior de la prueba, las calificaciones de cada forma nueva de la SAT que se
aplicaba cada año se igualaban estadística- mente a formas previas en la prueba.
La teoría de respuesta al ítem (IRT), que prescribe métodos de calibración para un con- junto
de reactivos de pruebas en un continuo de rasgos latente definidos de modo operativo (por
lo común representados mediante calificaciones estándar en el eje horizontal de una curva
de respuesta a ítemes), también se ha aplicado a la tarea de igualar pruebas. La propiedad
de inva- rianza de la muestra en los parámetros de reactivos en la IRT, que se abordó en la
explicación previa sobre análisis de reactivos, facilita el proceso de determinar calificaciones
equivalentes o igualadas en distintas pruebas.
Conclusión