Validez Vaiman
Validez Vaiman
Validez Vaiman
Validez
Lic. Marcelo Vaiman
Sofía se encuentra en la sala de espera de un consultorio
psicológico y mientras aguarda su turno, encuentra en una de las
revistas de moda y actualidad disponibles en la sala, un test denominado
“¿Qué tan osada eres?”. Responde a las 7 preguntas que lo conforman y
puntúa sus respuestas de acuerdo a una tabla de equivalencia de
puntajes. El resultado obtenido señala que es una persona “altamente
osada, que no teme a los desafíos ni a los riesgos”. Sorprendida con el
resultado obtenido, se lo comenta a su psicólogo con quien justamente
se encontraba trabajando ciertos miedos vinculados a tomar decisiones
financieras y a realizar un viaje de mochilera por el país. En base a ello y
para clarificar el diagnóstico, el psicólogo le administra el Test de
Propensión al riesgo (Meertens & Lion, 2008). Los resultados de esta
administración indican que Sofía tiene una personalidad que tiende a
evitar los riesgos. Entonces ¿a qué se deben estas diferencias en los
resultados? ¿en qué test hay que creer? ¿En qué se parecen y en qué se
diferencian un test publicado en una revista de entretenimientos y de
difusión masiva respecto a uno que utiliza un psicólogo y que ha sido
publicado en alguna revista científica o por alguna casa editorial?
Probablemente las semejanzas recaigan en que los autores de
ambos tests han tenido las mejores intenciones y han dado su mejor
esfuerzo para crear los ítems más representativos para evaluar tendencia
al riesgo u osadía. Las diferencias, sin embargo, están asociadas a que
para el primero, el test no ha sido sometido a un proceso de evaluación
que permita determinar si efectivamente las conclusiones que se
obtengan de las puntuaciones del test, realmente den cuenta del nivel
que la persona posee en ese rasgo o atributo. Es decir, ¿el test está
sirviendo a su propósito? ¿Es indicador del real nivel de propensión al
riesgo de la persona? ¿Puede predecir que esa persona se involucrará en
actividades, situaciones y decisiones de riesgo?
El conjunto de estas preguntas, apuntan a evaluar si efectivamente
el test sirve a su propósito. Más precisamente, si las puntuaciones que
se obtengan en el test, sirven en su propósito de evaluar y predecir. Estos
interrogantes son contemplados dentro del concepto de Validez. Un
concepto que tiene varios años en la historia de la psicometría y que
forma parte de las normas técnicas que rigen la construcción, adaptación
y uso de lo tests psicológicos.
La última edición de los “Standards for Educational and
Psychological Testing” define a la validez como el grado en que la teoría y
la evidencia empírica apoyan las interpretaciones que se hagan de los
puntajes de un test para un determinado propósito (AERA, APA & NCME,
2014). Como puede observarse, en esta definición se hace referencia a
que la validez no sería una propiedad del test en sí mismo, sino de las
inferencias que puedan realizarse de las puntuaciones que se obtengan
del test para propósitos específicos. Por ejemplo, la validez de las
interpretaciones que se realicen de las puntuaciones de una escala para
evaluar Desesperanza dependerá de la evidencia acumulada que avale,
por ejemplo, que los ítems que componen la escala, efectivamente
evalúan ese constructo y no otro similar o bien que las puntuaciones
permiten predecir la aparición o no, de conductas o cogniciones
asociadas con la desesperanza (ideaciones suicidas, pesimismo, intentos
suicidas). En este sentido, Messick (1989), considera que la validación es
un proceso continuo, que involucraría acumular evidencia científica de
tipo empírica, conceptual y estadística que apoye estas u otras
inferencias. Es por ello que la validez no sería una cuestión absoluta
(valido, no valido) sino de grado. Asimismo, los procesos de validación de
los tests, siempre se restringen a una población particular, que es la que
se utiliza en la muestra para realizar el estudio. En este sentido no es
adecuado generalizar la validación de un test a cualquier población que
no haya sido puesta a prueba en el estudio. Tampoco sería correcto
generalizar el uso del test para propósitos que no hayan sido evaluados
en estudios particulares.
En ésta última edición de los Standards se continúa sosteniendo a
la validez como un concepto unitario, a la vez que se siguen distinguiendo
fuentes de evidencias de validez y no tipos de validez (AERA, APA &
NCME, 2014). Estas distintas fuentes aluden a distintos aspectos de la
validez y son presentadas a continuación.
Proceso cognitivo
Identificar/memorizar/recordar Análisis Juicio
Total de ítems
Ejercicios en
que debe Situaciones
transformar en que
Contenido del
Nombres Autores Subescalas el puntaje debe
ítem
bruto de un decidir que
test a test usar
puntaje z
Test de
2 2 3 3 3 13
inteligencia
Tipo de test
Inventarios de
2 2 3 3 3 13
personalidad
Test
1 1 2 2 2 8
neuropsicológicos
Inventarios de
1 1 2 2 2 8
intereses
Total de ítems 6 6 10 10 10 42
Si se observa con detalle, se puede ver que las personas que tienden
a responder con puntajes altos en los items d, e y f, tienden a responder
con puntajes bajos en los items a, b y c. Y viceversa. Aunque también
puede ser como el caso 2, que se tiendan a responder a todos los items
con puntajes bajos. Esta pequeña muestra de participantes, en caso de
que si se ampliara el tamaño, mantuviera este tipo de distribución de las
respuestas, nos estaría mostrando que algo tienen en común los items a,
b y c, que las personas tienden a responder con puntajes semejantes en
ellos (ya sean valores altos o bajos). Al mismo tiempo, se tiende también
a responder con valores semejantes en los items d, e y f. En ese sentido,
se podría hipotetizar que habría dos factores latentes que incidirían en
las respuestas a esos 6 items. Claramente se trataría de autoestima física
para los primeros 3 y de una autoestima intelectual para los últimos 3.
De esa forma hemos hecho “a ojo” un análisis factorial de esos 6 items,
indicándonos la presencia de dos factores. Pero en la práctica esto es
imposible, pues las matrices suelen tener cientos de casos (no solo 6),
suele haber mucha mayor cantidad de items, y las resultantes no son tan
claras como la que se presentó. Es por ello que existen procedimientos
como el Análisis Factorial que nos ayudan a ese propósito.
Existen distintos tipos de Análisis Factorial, uno de los más
tradicionales es el exploratorio, que consiste en un conjunto de
procedimientos estadísticos que permite agrupar o reducir un número
determinado de variables. Para ello se parte de matriz de correlaciones
de las variables, que en este caso serían los items que componen al test,
y se evalúa si en esas correlaciones subyace algún patrón de relaciones
de manera tal que las variables puedan ser reordenadas en un conjunto
menor de factores, que serían variables latentes que resumen o explican
esas interrelaciones entre los datos (Pérez, 2004). En este tipo de análisis
factorial, el investigador no conoce la estructura subyacente al conjunto
de variables, aunque a veces puede suponerla y hasta tener expectativas
al respecto y su interés está en encontrar un número, en principio
indeterminado de factores comunes. De esta forma se agrupan ítems que
se correlacionan fuertemente entre sí, y cuyas correlaciones con las
variables de otros agrupamientos es menor, permitiendo de esta manera,
inferir la existencia de rasgos (factores) comunes (Aiken, 2003).