Diseño, Elaboracion y Aplicacion de Tests2
Diseño, Elaboracion y Aplicacion de Tests2
Diseño, Elaboracion y Aplicacion de Tests2
DISEO,
ELABORACIN Y
APLICACIN DE
TESTS
EDUCATIVOS
COGNOSCITIVOS
OBJETIVOS A LOGRAR
Luego de leer y comprender esta unidad escrita, usted estar en condiciones de:
CONTENIDOS DE LA UNIDAD
5. Prueba Oral
5.1. Definicin y Clasificacin
5.2. Ventajas y Desventajas
5.3. Sugerencias para Disear y Elaborar Pruebas Orales
5.4. Sugerencias de Aplicacin de la Prueba Oral
6. Prueba de Ensayo
6.1. Definicin
6.2. Ventajas y Desventajas
6.3. Sugerencias para Disear y Elaborar Pruebas de Ensayo
Tabla de Especificaciones de una Prueba de Ensayo
6.4. Sugerencias de Aplicacin y Correccin de la Prueba de Ensayo
7. Prueba Objetiva
7.1. Introduccin
7.2. Definicin y Clasificacin de los Tests Objetivos
7.3. Ventajas y Desventajas de los Tests Objetivos
7.4. Diseo de los Tests Objetivos
Tabla de Especificaciones de una Prueba Objetiva
7.5. Elaboracin de los Tests Objetivos
7.6. Correccin de los Tests Objetivos
REFERENCIAS
AUTO-EVALUACION
1.1. Concepto
TEST:
Cualquier tipo de prueba psicolgica o/y educacional. El test o la prueba educativa
representa la forma concreta con la cual pretendemos obtener una buena estimacin
(analgica) del aprendizaje real logrado por nuestros alumnos. Sea cual fuere la forma del
test (escrito, oral, etc.), ste pretende mediante la representacin lgica y jerrquica de sus
preguntas, estmulos, reactivos o temes captar el rendimiento escolar o acadmico, de tal
suerte que se convierte per se en el medio por el cual comparamos aprendizajes deseados
con aprendizajes logrados manifestados (rendimiento escolar), a fin de determinar xito
educativo.
1.2. Clasificacin
Como toda clasificacin es arbitraria, no existe la clasificacin nica de tests educativos.
Muy a nuestro pesar, los criterios clasificatorios son de muy variada naturaleza y nivel. Se
han usado los siguientes: forma, estructura, dominio de aprendizaje, atributo, individual
grupal, pertinencia a alguna funcin evaluativa o de medicin especfica etc.
Para desarrollar esta unidad seleccionamos los siguientes criterios: atributo, dominio de
aprendizaje, forma y estructura. Tal como lo advierte el ttulo de la unidad, los tests son
educativos y pertinentes al dominio de aprendizaje cognoscitivo
CRITERIOS
En cuanto a la forma,
seleccionamos y ordenamos De acuerdo a su estructura
los tests ms usados en los jerarquizamos :
educacin:
Escrita De menos A ms
(Prueba de estructur
Oral, ensayo y estructur ados
test ados (o (Test
objetivo). ms Objetivo)
abiertos) .
P. Oral
Adems, como se ha comprobado que existe una estrecha relacin entre el grado de
estructuracin de los tests y la objetividad de correccin y puntuacin, existe un criterio
supuesto: la objetividad de correccin. Fcilmente se advertir que los tres tests elegidos
estn presentados de acuerdo a un grado creciente de objetividad de correccin: Prueba
Oral, Prueba de Ensayo, Test Objetivo.
Todo instrumento o tcnica de medicin educativa que pretenda medir el aprendizaje debe,
necesariamente ser pensado, planificado, diseado previa elaboracin del mismo; y no
viceversa. Este diseo queda finalmente traducido grficamente por las tablas de
contrastabilidad, anlisis bidimensional, producto cartesiano o tabla de doble entrada. En
aquel queda manifiesto el aprendizaje a medir y la importancia de las conductas y
contenidos a contrastar (visto por medio de porcentajes o cantidad de preguntas por
columnas e hileras). Es evidente que la planificacin o diseo de cualquier test educativo
para medir aprendizaje deba considerar los siguientes aspectos:
No obstante, toda o casi toda la planificacin o diseo del test educativo se puede reducir a
estos tres aspectos:
hilera, lo que demuestra la importancia de cada contenido particular. Las celdillas o cruce
de las columnas con las hileras representan el total de temes que se pretende confeccionar
para cada objetivo especfico que medir la prueba.
Si usted aprecia ambos conceptos ver que en ambos existe un elemento comn (conducta).
Y, en ambos tambin se encuentra el concepto experiencia; ya que por medio de inferencias
semnticas se puede concluir que:
Por lo tanto, todo aprendizaje deseado es igual a objetivo educacional deseado a nivel de
alumno. Se sigue, entonces, que la citada tabla de especificaciones permite disear y
elaborar instrumentos o tests para medir aprendizaje, pues:
presentan Gagne Briggs (1974). Estas ltimas son particularmente tiles cuando se
aplica una jerarquizacin y formulacin distinta a la de Bloom et al (1969). Incluso, es
posible para la determinacin conductual (en las columnas) establecer tres niveles de
operatividad:
En la prctica, a veces se funden tales principios de elaboracin. Sin embargo, los tres
criterios ms usados son: dificultad creciente, abstraccin creciente y contenidos
simpticos de informacin. La inclusividad no se usa mucho, pues a veces es confundida
con la presentacin reiterada de los mismos tems en el mismo test.
Figura 1:
Mezcla de criterios de elaboracin de tests educativos: dificultad y abstraccin creciente,
contenidos simpticos.
Toda prueba educativa que pretenda medir aprendizaje debe contener una serie de
caractersticas que den cuenta de su calidad y eficacia. Las pruebas sern buenas,
mediocres o malas en la medida que se ajusten alas siguientes caractersticas:
Representativida
Validez d Confiabilidad
Objetividad
Discriminacin
Dificultad
Practicidad
Adems, para poder concretar alguno de los tres propsitos evaluativos educacionales
(diagnstico, formativo o sumativo) en sus doce respectivas aplicaciones (diagnosticar,
comparar, clasificar, controlar, orientar, supervisar, motivar, calificar, seleccionar, juzgar,
decidir y predecir) es necesario que los datos arrojados por los tests educativos
(rendimiento escolar) sean analizados estadsticamente para poder decidir si procede o no
procede determinar tal o cual funcin a la luz de alguna de estas caractersticas.
Finalmente, estas caractersticas deben ser analizadas bajo el prisma de los modelos
educacionales tradicionales o modernos para arribar a interpretaciones pertinentes y
atinadas. Por ejemplo, es muy distinto el ideal de dificultad en educacin tradicional que en
educacin moderna. Se encuentran en rangos porcentuales definitivamente diferentes. Igual
cosa procede con la discriminacin de los tests. El ideal de los modelos tradicionales es
justo el opuesto al de los modelos educativos modernos .
Representativida
d
La representatividad de los tests tiene que ver con el muestreo balanceado de los objetivos
estimados importantes en una unidad de aprendizaje particular. Es difcil construir tests que
midan todos los objetivos educativos de una unidad. Lo que en realidad se hace es extraer
(muestrear) del total de objetivos aquellos ms tpicos o representativos. Se sigue, entonces,
que la mayora de los tests educativos muestrean los objetivos educacionales a nivel de
alumno = aprendizaje deseado. Extrapolando, un alumno puede obtener una nota 7,0 por
haber contestado todas las preguntas; pero, incluso a pesar de haber contestado todas las
preguntas acertadamente, no domina todos los objetivos de una unidad de aprendizaje o
programa; slo domina aquellos objetivos educacionales que se miden en la prueba.
Validez
La validez se refiere a la precisin con que una prueba mide conductas o comportamientos
implcitos en los objetivos educacionales que se desean comprobar. La validez tiene que ver
con la correspondencia, relacin o pertinencia del instrumento con el tipo, forma y
estructura del atributo a medir (aprendizaje) (Pizarro, 1978). Con la validez se prueba el
carcter isomrfico de la medicin. Se puede decir que una prueba es vlida toda vez que
mide aquello (atributo) para lo cual fue diseada y elaborada.
1) Validez de Contenido
La validez de contenido se refiere a la relacin que debe existir entre los temes,
pregunta o reactivos (y el test en general) con los contenidos y objetivos de la unidad
de aprendizaje. Para que los tests tengan validez de contenido estos deben medir lo
que deben y no otra cosa .Este tipo de validez est muy relacionado con la
representatividad de los instrumentos diseados. Si ,por ejemplo, vamos a prepara un
test para medir el aprovechamiento en el uso de la lengua materna, debemos en
primer lugar determinar las habilidades, conocimientos y comprensiones que
corresponden al uso correcto y efectivo de la lengua materna especificados en los
objetivos educacionales pertinentes -; luego examinar si el test que se piensa elaborar
es el ms adecuado para medir tales habilidades, conocimientos y comprensiones; y,
posteriormente debemos comparar el anlisis del contenido del test con el anlisis del
contenido y los objetivos del curso para ver hasta que punto el primero representa al
segundo. En la medida que los resultados que hemos aceptado como objetivos del
curso estn representados en el test, ste ser vlido.
2) Validez de Construccin
Se refiere al grado de relacin que deben poseer los datos observados con el atributo
definido y medido (2). O bien, se puede decir que un test tiene validez de
construccin en la medida que nos proporciona informacin acerca de una
caracterstica o atributo significativo del individuo. Cuando los tests o mejor dicho,
3) Validez de Concurrencia
Se refiere a la relacin de incidencia que existe entre los puntajes de los tests y
criterios contemporneos apropiados externos al test mismo. Si por ejemplo, un
alumno que tiene un buen puntaje en un test de ortografa, manifiesta la misma
habilidad en tareas como redactar composiciones o hallar errores ortogrficos en sus
trabajos, estaramos en condiciones de afirmar que existe validez concurrente. Si se
ve la relacin que existe entre los datos de un test de personalidad y evaluaciones
clnicas de la personalidad realizadas por psiclogos (criterio externo al test de
personalidad) en una unidad de tiempo similar (contemporneo) estamos midiendo
validez concurrente.
4) Validez Predictiva
Tiene que ver con la estimacin futura que hacemos de algn atributo o caracterstica
especfica en base al mismo atributo o a otros que tienen alguna relacin concurrente.
Al atributo a predecir se le denomina generalmente criterio, y a las variables que
pretenden predecirlo se les denomina predictores. Por ejemplo, predecir futuro xito
en los estudios universitarios (criterio, atributo), usando para ello los siguientes
predictores: Prueba de Aptitud Acadmica ( Matemtica y Verbal ), Promedio de
Enseanza Media (NEM), Pruebas Especficas, etc.
Confiabilidad
Podemos confirmar que existe confiabilidad cuando los resultados de las pruebas aplicadas
en diversas oportunidades no varan demasiado o son aproximadamente similares. Por lo
mismo, se puede explicar la confiabilidad como el grado de consistencia o constancia que
existe entre repetidas mediciones del mismo test aplicado a un mismo grupo de personas. A
pesar de que entre aplicaciones distintas del mismo test (al mismo grupo ) existe variacin,
(provocada por cansancio, maduracin, fraude, azar, olvido, etc.), sta debiera mostrar una
cierta coherencia y consistencia. Nunca los datos generados por aplicaciones diversas sern
idnticos ,pero debieran asemejarse para suponer que los tests son confiables.
Objetividad
Dificultad
En cambio, para los modelos modernos de educacin, que se basan en la teora del
aprendizaje, la dificultad ptima de los tests educativos debiera oscilar entre un 75 % y un
100 % del total de los temes, pues lo que se quiere ya no es establecer diferencias entre los
alumnos; sino ms bien, que stos dominen los objetivos propuestos. Como se podr
apreciar, la interpretacin acertada de la dificultad de los tests educativos debe ser vista a la
luz de las consideraciones tradicionales (psicometra) o a la luz de las consideraciones
modernas de educacin (edumetra). Los ideales de dificultad son en ambos casos
radicalmente opuestos, obedecen a fundamentos tericos distintos, y se ubican en un
espectro porcentual diferente.
Discriminacin
Al igual que la dificultad, la discriminacin del test debe ser entendida a la luz de los
modelos educativos tradicionales y modernos. Si toda la educacin tradicional, ms o
menos hasta la dcada del 60, se basaba en el comportamiento grupal normativo, y ste en
la psicologa diferencial que debe su fundamento a la teora darwinista o corriente
evolucionista, y que se basa justamente en las diferencias individuales - se podr advertir
que el ideal de discriminacin en los modelos tradicionales sea altsimo (entre un 70 % y un
100 %) de tal suerte que traduzca y justifique, a la vez, las reales diferencias en el grupo o
entre los alumnos buenos y malos . En cambio, el ideal de discriminacin en los
modelos modernos debe oscilar entre un 0 % y un 30 %, pues lo que se pretende es que
todos o casi todos los alumnos puedan dominar lo que se les ensea. Si tal supuesto es
logrado, al final habr un comportamiento homogneo superior bordeando el total de
temes del test - lo que implica que la diferencia entre los alumnos es nfima, lo que a su
vez redunda en una bajsima discriminacin. Los ideales de discriminacin en los modelos
tradicionales y modernos se ubican justamente en los extremos opuestos del espectro
posible de diferencias existentes entre los puntajes de un test.
Practicidad
Las buenas pruebas, adems de poseer caractersticas de tipo mtrico, debieran ajustarse a
ciertos criterios que hagan factible su uso. Tales criterios son los siguientes: adecuabilidad
al tiempo estipulado, el tiempo empleado en la construccin, el tiempo empleado en la
aplicacin o administracin de las pruebas, costo del material, comodidad para la
correccin, puntuacin y calificacin. Los tests son ms o menos prcticos en la medida
que se respetan estos criterios de funcionalidad o practicidad. No se gana mucho con tests
mtricamente perfectos si usted no sabe como aplicarlos adecuadamente; o, si para
aplicarlos debe dar largas explicaciones a los alumnos.
5 PRUEBA ORAL
5.1.1. Definicin:
5.1.2. Clasificacin:
Segn Lafourcade (1973), las pruebas orales se pueden clasificar de acuerdo al grado de
estructuracin de la base o de las preguntas en:
Formales
Informale
s
Se caracterizan por no ser avisadas y por considerar
a una parte del curso para calificarlo. Este tipo de
prueba sera el de respuestas accidentales.
5.2.1. Ventajas
A pesar de ser las pruebas de ms antigua data y las ms cuestionadas de todas las
pruebas educativas para medir y evaluar el aprendizaje de tipo cognoscitivo, la prueba
oral presenta ciertamente las siguientes ventajas:
5.2.2. Desventajas
Entre las crticas o desventajas ms importantes que se le han hecho a la prueba oral,
podemos establecer las siguientes:
Conductas
TOTAL
En primer lugar, para la hilera Conductas se puede usar cualquier intento jerrquico de
objetivos educacionales: Bloom et al; Mager; Gagne; Gagne Briggs; Metfessel et al.
Puesto que los contenidos van a presentarse jerarquizados en la columna dos, estas
conductas pueden repetirse en caso de que el objetivo as lo requiera.
El Puntaje asignado a cada tem particular debe estar ntimamente relacionado con el
nivel conductual y la dificultad que ste presenta. No tienen por qu valer todos los
temes lo mismo.
En la columna cinco (Estimacin de Tiempo) se sugiere estimar por cada tem el tiempo
de respuesta del profesor y el de los alumnos. Generalmente los alumnos se demoran
entre 2 y 4 veces ms que el profesor. Sin embargo para afinar este criterio, es deseable
probarlo empricamente. Adems, es recomendable dar un tiempo de alrededor de 10
minutos adicionales por alumno, a no ser que se trate de un examen, donde este tiempo
puede aumentarse dependiendo del nivel y tipo de objetivos en juego.
El maestro debe seleccionar previamente las partes del contenido que desee
explorar y determinar su relacin con los objetivos (pertinencia, representatividad
y validez).
Para reducir la improvisacin, elaborar una lista detallada de preguntas y
ejercicios que cubran los aspectos importantes previamente determinados.
Construir una serie de temes mayor que los que generalmente se elaboran para las
pruebas de lpiz y papel (prueba de ensayo, por ejemplo).
Ordenar las tarjetas individuales (fichas de materia) que contienen a los temes de
acuerdo a su relacin con los objetivos que la prueba oral pretende medir y
evaluar
Procurar que el grado de dificultad de los temes pertenecientes a un mismo
objetivo posean un grado similar o parecido.
Aplicar, de ser posible, los temes experimentalmente para estimar posible tiempo
de respuesta.
Establecer previamente las normas y/o criterios de calificacin.
Registrar las respuestas de los alumnos hasta donde sea posible. Para esto, se
sugiere tener anotado un punteo en la ficha donde est la pregunta de los
aspectos estimados correctos, medianamente correctos y deficientes, de tal suerte
que el registro se haga posible por medio del uso de marcas o vistos.
Tener en cuenta, para la calificacin, los siguientes aspectos: dominio del tema y
claridad/efectividad de la exposicin o respuesta.
Cuando se va a aplicar una prueba oral, debemos considerar las siguientes sugerencias:
6. LA PRUEBA DE ENSAYO
6.1. Definicin
La prueba de ensayo es una prueba de lpiz y papel que presenta pocos reactivos, cuyas
respectivas respuestas son graficadas mediante una composicin o ensayo de libre
elaboracin, estilo y originalidad por parte del alumno.
Cuando las preguntas estn mal expresadas o en forma difusa, stas pueden ser
mal interpretadas por los alumnos. Por lo mismo, presentan, a veces, temes que
hacen escasa su comprensin. Por lo general, en la prueba de ensayo, mientras
ms especificas y largas sean las preguntas, las respuestas sern ms precisas, y
sobretodo cortas; lo que es muy importante pues invalida discursos en los cuales
abundan hermosos y artsticos disparates que no vienen al caso.
Es la prueba que ms gasto de tiempo necesita para corregir y calificar. De todas
las pruebas que pretenden medir aprendizaje cognoscitivo es la ms cara en
tiempo.
Son difciles de calificar y por lo general muy subjetivas. Es difcil mantener un
criterio nico de correccin y ms an de puntuacin para todos los alumnos.
Respecto de la subjetividad, es una prueba intermedia entre la prueba oral y la
prueba objetiva. Influyen a veces, en la correccin, aspectos extraos al
aprendizaje mismo: simpatas, efecto de Halo, prejuicios, etc.
Por todo lo anterior, las pruebas de ensayo adolecen de confiabilidad. Es seguro
que de corregir dos o ms veces la misma prueba por el mismo profesor, no
llegar al mismo resultado (poca objetividad, y por lo mismo poca confiabilidad).
Las pruebas de ensayo son, en resumen, poco prcticas, pues a pesar de la
economa del material, se ocupa demasiado tiempo en corregirla; adems, no
ayudan a fomentar la planificacin cuidadosa tanto de las preguntas, como del test
en general, tal como suele fomentarla la prueba objetiva.
Es til recordar, sin embargo, que ninguna prueba puede por si sla medir todos los
objetivos educacionales. Debemos variar en la aplicacin de las pruebas. No siempre
ser til una prueba de ensayo, ni una prueba oral. Adems, recuerde que ninguna prueba
es perfecta. Todas tienen sus problemas (ventajas y desventajas), por lo mismo debemos
aprender a usarlas cuando corresponda.
Conductas
TOTAL
La columna uno que abarca la Identificacin de los Contenidos y la Unidad de
Aprendizaje, las Conductas; y al Total de cada columna en particular demuestra
principalmente su importancia por el tipo y nivel de conductas que en ella deben ir
analizadas. Al respecto, las conductas pueden repetirse siempre que el contenido as lo
requiera.
La columna seis presenta la Estimacin del Tiempo que debe hacerse de la prueba de
ensayo; para lo cual recomendamos probarla empricamente con el profesor y/o ayudante;
luego estimar entre 2 a 4 veces ms el tiempo posible de respuesta de los alumnos. Es
til afirmar que de estar mal estimado el tiempo posible de respuesta para los alumnos, se
puede correr el riesgo de invalidar el contenido y la construccin de la prueba, pues ya no
se estara midiendo aprendizaje sino, talvez ,velocidad de respuesta. A veces los alumnos
no tienen el tiempo necesario para contestar. Toda vez que esto acontece demuestra una
mala estimacin del tiempo de respuesta. Recomendamos anotar el tiempo de inicio y de
trmino de cada alumno particular una vez que stos terminen la prueba. As, usted podr
afinar cada vez ms su estimacin.
Nivel:
UNIVERSITARIO CONTENIDOS TIPO DE NMERO DE PUNTAJE
Asignatura: PREGUNTAS DE ESTIMACIN TIEMPO
EVALUACION PREGUNTAS PREGUNTAS
Unidad:
LA EVALUACION PROFESOR ALUMNO
EDUCACIONAL
Conductas
Comprensin: - Necesidad de la - E 1 2 3 9
Evaluacin. xplicacin
Interpretacin
- Modelos 4 3 2 3 9
Educativos: T-M - C
omparacin
- Merma de 5 3 4 12
Aprendizaje
- C
ausas y Efectos
Anlisis:
Totales 5 11,5 15 45
Luego de haber diseado la prueba de ensayo diseo que tambin puede hacerse como
una tabla de doble entrada, al igual que los diseos de los tests objetivos; ver pgina 21
debemos preocuparnos por elaborar la prueba. Tal elaboracin debe implicar los
siguientes aspectos:
o Se sugiere que las preguntas de la prueba de ensayo tengan una dificultad intermedia
y que estn de acuerdo al nivel de madurez de los alumnos.
o En lo posible, entregue la prueba por escrito junto con las instrucciones de lo que los
alumnos deben hacer. Motivo: ahorro de tiempo y orden en la aplicacin de la prueba.
o Elaborar una pauta de correccin escrita que contenga puntos o aspectos estimados
correctos, medianamente correctos y deficientes. La pauta puede tener solamente
puntos especficos estimados correctos. No puede ni debe estar redactada la respuesta
correcta por pregunta; ya que en esta prueba no hay una sola respuesta correcta; o
mejor dicho, no existe una sola forma de respuesta correcta.
12 Clasificar.
13 Aplicacin de reglas o principios a situaciones nuevas.
14 Discusin.
15 Establecimientos de fines propsitos de un autor ledo.
16 Crtica de la propiedad, correccin o importancia de un escrito dado.
17 Resumir.
18 Reorganizacin de hechos.
19 Formulacin de preguntas originales.
20 Nuevos mtodos y procedimientos.
El buen hijo de vecino (B. H. de V.) supone que debe haber muy profundas y slidas
razones para justificar la existencia de los tests. Sospecha, incluso, que ha de tratarse
de razones sicosociolgicas. O sea, divisa pocas posibilidades de que el cualquiera-
llegue a entenderlas.
Por qu piensa esto el buen hijo de vecino?
Hay varios motivos:
a. Las personas que practican, promueven y toman en serio los tests son, por lo
general, respetables.
b. Nunca se ha visto que se ran al someter a sus vctimas al proceso testl ... (Cmo
se dir?)
c. Es un mtodo de aceptacin universal.
El juego perdn: la prueba- consiste en cruzar con una marca vertical el guin que ms
le tinque.
Antes de hacer la marquita, reflexiona un rato. Lo primero que se le ocurre son los contra.
Si el alumno no necesita escribir nada, cmo extraarse de que tenga un vocabulario
pobrsimo, en que el 90% de los sustantivos son uno slo: cuestin?. Y quin podra
sorprenderse de que redacte como una bestia?.
Con un dejo de nostalgia piensa en los hermosos, casi artsticos disparates que se
producan en sus tiempos. El test cierra toda posibilidad a la imaginacin creadora y a la
iniciativa privada: es el profesor el que pone, junto a una verdad, dos errores optativos. Y
habitualmente fomes. Tampoco puede sorprender, as, que en los chiquillos se desarrolle
una marcada flojera mental.
Supongamos sigue reflexionando el B. H. de V.- que mi hijo conoce al dedillo la vida y
milagros de Empdocles. Que ley a Digenes Laercio, a Werner Jaeger y a Vctor Duruy.
Para qu le sirve? Para poner la misma rayita vertical que:
Y, bueno, al azar, es otro elemento. Si el tipo ignora la respuesta, hace un rpido ene-tene-
tu, y tiene justo un 33,33% de posibilidades de acertar.
a) Embrutecer al alumno.
b) Dejar que el factor suerte resuelva su destino.
c) Simplificar hasta la abulia el trabajo de los correctores.
S se repite-, tiene que haber profundas y slidas razones para justificar la existencia de
los tests. Qu ganas suspira- de conocerlas.
Por lo mismo, todos los tests objetivos tienen un puntaje azar y un puntaje mnimo de
aprendizaje; el cual permite pronunciarse respecto de si los puntajes de un test
objetivo con o sin descuentos- obedecen razonablemente a un real aprendizaje
logrado; o si se deben a mera adivinacin (Pizarro, 1978).
Como mencionamos, en las pginas 3-4, todo diseo emplea la jerarquizacin de algn
dominio de aprendizaje particular. Por motivos de comodidad, y puesto que los alumnos
conocen mejor las taxonomas de Bloom, et al, antes que a Gagne, usamos la primera.
Como usted podr apreciar en el diseo que se adjunta en la siguiente pgina, la prueba a
elaborar tiene que ver con la teora de tests (diseo y elaboracin de tests educativos).
Tanto las conductas (columnas), como los contenidos se presentan jerarquizados.
Adems, cada uno de ellos debe estar suficientemente detallado.
Generalmente, en los tests objetivos, se miden entre dos y seis tipos diversos de
conductas, y un nmero semejante de contenidos. De lo contrario, es muy probable que
el futuro test objetivo adolezca de representatividad al tener pocos temes-, y no permita
una adecuada variacin conductual. Ahora, la importancia de las conductas del diseo de
la prueba, debe coincidir con la importancia atribuda a las conductas u objetivos en
general, antes de empezar el diseo. Y, tal importancia conductual se refleja en los
montos nmero de temes o porcentajes- de las columnas finales.
As, se puede apreciar que los objetivos ms importantes del diseo adjuntado (ver la
pgina siguiente) corresponden a la categora conductual Aplicacin; le sigue
Comprensin, luego Anlisis y, finalmente Conocimiento. A su vez, el contenido que
tendr la mayor cantidad de temes es aquel pertinente a la planificacin o diseo, y
elaboracin de Tests educativos: Test Objetivo, Prueba de Ensayo y Prueba Oral, con 20
temes que corresponden el 50% del total de las preguntas.
CONDUCTAS CONOCIMIENTO COMPRENSIN APLICACION ANLISIS
6 9 15 10 40
Una vez establecido el diseo, se procede a elaborar el test objetivo y no viceversa; aunque
se puede proceder inversamente cuando hay bastante dominio taxonmico y entrenamiento
en la construccin de los temes.
La elaboracin completa del test objetivo comprende construir los siguientes elementos :
- Folleto
- Hoja de Respuestas
- Plantilla de Correccin
FOLLETO:
Consta de dos partes : Hoja de Instrucciones y Cuadernillo de Preguntas.
Hoja de instrucciones.
Las instrucciones que se dan al alumno para contestar el test objetivo son las
siguientes:
Estas instrucciones son necesarias para el buen desarrollo de cualquier test objetivo;
no obstante, usted puede adjuntar otras que estime conveniente. Las instrucciones se
colocan siempre antes de los temes.
Respecto del tiempo que deben durar los tests objetivos ste tiene que ver con el
nmero de temes, su forma y su facilidad o dificultad. Adems, debe existir un
equilibrio entre tres tipos de tiempos: Tiempo de lectura, Tiempo de
comprensin y Tiempo de marca.
En la instruccin nmero 3) se hace alusin a los tipos de temes del test objetivo. La
forma de los temes tendr que ser pertinente a los objetivos educacionales.Hay
objetivos que pueden ser medidos mejor con un tem V-F que con una pregunta de
SM . Cuando utilice una mezcla deV-F + SM (de tres, cuatro o cinco alternativas)
procure que el porcentaje de los temes V-F est entre un 20% y un 30% del total de
temes de la prueba; de otra manera, el azar de V-F influir excesivamente en el azar
promedio ponderado de la prueba total (Pizarro, 1978).
Todos los temes objetivos poseen solamente una alternativa correcta (instrucciones
4), 5) y 6) ). Cuando exista una alternativa ms correcta que las otras es
recomendable decirlo en el enunciado, por ejemplo: ... la mejor..., ... la ms
exacta, etc. Tambin, puede haber ms de una respuesta correcta. Tal es el caso de
los temes de Seleccin Mltiple con requisitos (nmeros romanos). En ellos,
generalmente se pregunta adems de lo correcto- por las relaciones entre las
respuestas correctas y/o incorrectas. Pero, a pesar de haber varias respuestas
correctas, existe una sola alternativa que las contiene.
Es muy raro, pero no imposible, que algn estudiante piense y acte en consecuencia
respecto de marcar ms de una preferencia. Algunos piensan que al haber una
plantilla de correccin resulta fcil engaar a los profesores marcando ms de una
preferencia por tem. Toda vez que esto suceda considere incorrecta la respuesta
debido al fraude. (Instruccin 6) ).
Todo tem bien contestado vale un punto (instruccin 10). Cmo es posible que
todos valgan lo mismo, cuando es bien sabido que corresponden a distintas
dificultades y/o niveles de aprendizaje?. Si adoptamos un criterio de construccin
basado en la dificultad creciente, deber haber una cantidad mayor de temes fciles,
una cantidad intermedia de medianamente fciles; y, una menor de temes difciles.
Por ello, si pondersemos los temes, tendramos un puntaje promedio que equivaldra
a los temes de dificultad media. Ahora, como se ha comprobado que da casi lo
mismo ponderar o no ponderar los temes, se ha escogido el valor uno para todo tem
corregido. Motivo: rapidez y economa de tiempo.
Cuadernillo de preguntas
La parte ms importante del test objetivo al igual que de cualquier test educativo- la
constituye la presentacin de sus temes, reactivos, estmulos o preguntas. Sin
embargo, por la forma y estructura, esta prueba presenta caractersticas privativas.
Todo test objetivo tiene una Regla Fundamental que indica la lgica interna de
construccin. Esta regla dice lo siguiente:
Solo debe llegar a la alternativa correcta el alumno que sabe (y sabe bien). Para el
alumno que no sepa o que dude de su aprendizaje- todo debe parecerle igualmente
plausible como c orrecto.
a. temes Verdadero-Falso
Ventajas
Las principales ventajas de los temes Verdadero-Falso son las siguientes:
Son, aparentemente, ms fciles de construir que los temes de Seleccin
Mltiple. A veces, uno se deja llevar por la forma del tem, y cree que porque
ste es ms corto es ms fcil de elaborar. Sin embargo, a veces cuesta bastante
encontrar afirmaciones o proposiciones que adems de ser pertinentes al
objetivo a contrastar- sean totalmente verdaderas o totalmente falsas.
No exigen mucho tiempo de respuesta .
Se usan preferentemente para medir objetivos de baja abstraccin:
conocimiento y comprensin, segn taxonoma de Bloom, et al.
Son de relativa facilidad, o mejor dicho, son fciles (85% de dificultad). Por lo
mismo, convencionalmente, estos temes estn colocados al inicio de todo test
cuando forma parte de una batera- pues su facilidad motiva o genera una
actitud positiva frente a las siguientes preguntas .
Desventajas
Las principales desventajas de los temes Verdadero-Falso son las siguientes:
Otorgan mucha probabilidad de fraude, pues en su respuesta buena o mala-
existe un 50% de factor azar. Se dispone de dos alternativas: Verdadero o Falso.
No son los temes que se prestan mejor para medir conductas u objetivos
educacionales complejos: aplicacin, anlisis, evaluacin.
Si son fciles, no discriminan adecuadamente, pues la varianza y por lo mismo
la discriminacin ptima- se da justo cuando la dificultad alcanza a un 50%
(varianza = p q = 0,25). Por lo tanto, este tipo de temes no se ajusta
demasiado al ideal de discriminacin tradicional: separar adecuadamente y en
forma categrica los buenos alumnos de los malos alumnos.
Por la explicacin previa, se sigue que no son confiables, pues en gran medida
las frmulas tradicionales para estimar la confiabilidad dependen demasiado del
monto de la varianza.
Forma de presentacin:
X. ________________________________________________________
________________________________________________________
5. Cuando redacte un tem V-F tenga presente que aqul debe contener slo el
material necesario, a fin de darle claridad y precisin. Por ello, evite usar
proposiciones extensas y complejas; de otro modo, adjuntar material poco
pertinente que har del tem un reactivo poco eficaz.
Ejemplos Malos:
- Debido a las investigaciones acrecentadas en los ltimos aos, el cncer de
pulmn sera motivado por el uso abusivo de los cigarrillos.
- Clulas de determinada clase pertenecen a un grupo particular que cumple
un deber especializado. A este grupo de clulas lo llamamos tejido. Las
membranas mucosas pertenecen a los tejidos epiteliales.
Existen varias razones por las cuales tales temes son poco eficaces. Por un
lado pueden confundir al alumno; por otro, dan excesiva informacin, con lo
cual habilitan respuestas correctas. Generalmente los temes ( o las alternativas
en el caso de los de SM) ms largos son ms correctas que incorrectas.
Recuerde que cada enunciado o proposicin debe contener slo y nada ms que
lo necesario.
7. Por lo general, limite los enunciados o proposiciones V-F a una sla idea. No
incluya ms de una proposicin en el mismo tem.
Ejemplo Malo:
- El sangrado de las encas est relacionado con la gingivitis y quien la
padece puede curarse por si mismo con slo cepillarse los dientes
diariamente.
9. Los temes deben presentar una extensin similar. Ni muy corta, ni muy larga.
Cuando los temes son muy largos existe una alta probabilidad de que sean
verdaderos pues se tiende a explicar mejor lo correcto; y viceversa.
Ejemplos Malos:
- El agua hierve a 100 grados.
- En la puna llueve mucho.
- La suma de los temes, reactivos, preguntas o estmulos produce una
prueba determinada.
- Las personas que beben grandes cantidades de alcohol y consumen una
dieta inadecuada padecen frecuentemente una enfermedad orgnica
denominada cirrosis del hgado.
En los dos primeros casos sera aconsejable omitir, o bien considerar los temes
como falsos debido a la escasa informacin que brindan. En los dos ltimos ,
habra que contestar a fuerza de demasiada reiteracin y/o explicacin-
verdadero. El ltimo tem adems de ser largo, contiene un determinante
especfico verdadero: frecuentemente.
10. Evite usar palabras trampas, pues engaan al alumno. Esta sugerencia tiene
que ver con la N6. Los temes tienden a ser capciosos cuando el alumno tiene
que elegir una palabra o un nmero de una proposicin que parece versar sobre
algo radicalmente distinto.
Ejemplos Malos:
- Los escorpiones, insectos de ocho patas, viven en lugares desrticos.
- Los Watusies, pigmeos de raza negra, viven en frica.
siempre, nadie, ningn, jams, etc., son trminos que expresan un grado de
generalizacin tan amplio y categrico, que determinan la falsedad de las
proposiciones o temes que los contienen. En cambio, palabras tales como:
frecuentemente, a veces, es posible, es probable,la mayora de las veces,por lo
comn talvez, posiblemente,puede, etc., suelen condicionar afirmativamente a
las proposiciones que las contienen.
Ejemplos Malos:
- Todas las bacterias causan enfermedad.
- La diabetes se desarrolla ms frecuentemente despus de los 40 aos de
edad.
- Las frutas pueden conservarse secndolas.
En primer tem esta condicionado por la palabra todas (F). Los otros dos
estn condicionados afirmativamente (V) por las palabras: ms
frecuentemente y pueden, respectivamente. Sin embargo, los determinantes
especficos pueden ser usados en ciencias exactas, donde palabras tales como:
todos, siempre, etc. tienen lugar.
12. Evite usar dobles negativos en la redaccin de sus temes V-F; o bien usar
demasiado los enunciados negativos. Razones: se ocupa mayor tiempo al
intentar responder temes formulados negativamente. Adems, es
semnticamente ms difcil comprenderlos. Tambin, y es bastante comn, los
alumnos leen demasiado aprisa los tests objetivos saltndose, por lo mismo, las
partculas negativas. Si va a usar un enunciado negativo, subraye la o las
partculas en cuestin.
Ejemplos Malos:
- La tuberculosis no es una enfermedad no transmisible.
- En Camelot ningn personaje es innecesario para el desarrollo del
argumento.
- No sera errneo afirmar que las jerarquizaciones de los dominios de
aprendizaje han servido para determinar objetivos educacionales.
13. No construya temes negativos slo por el hecho de agregarles el trmino no.
Son innecesariamente complejos para los alumnos. Es preferible preguntar por
cosas que son y no por aquellas que no son.
Ejemplos Malos:
- El General San Martn no cruz la Cordillera de los Andes.
- La tuberculosis no es una enfermedad transmisible.
14. El lenguaje que utilice en la redaccin de los temes debe ser pertinente al nivel
del alumno a quien se aplicara. Este debe conocerlo. A continuacin
presentamos dos ejemplos deficientes en cuanto a la mala aplicacin del
lenguaje en un test objetivo para 8 Bsico.
Ejemplos Malos:
- A un elefante se le puede dirigir mediante el focino.
- El uso promiscuo de pulverizaciones, aceites y antispticos en la nariz,
cuando se sufre de catarro agudo, es pernicioso porque pueden tener un
efecto deletreo.
Ventajas
Las principales ventajas de los temes de Seleccin Mltiple (SM) son las
siguientes:
Desventajas
Las principales desventajas de los temes de Seleccin Mltiple (SM) son las
siguientes:
Son algo difciles de elaborar y estructurar. Pinsese, por ejemplo, en toda la
tcnica de buscar los mejores distractores para habilitar respuestas alternativas
Los tems de Seleccin Mltiple son preguntas objetivas altamente estructuradas que
se caracterizan por presentar un enunciado, tronco, o base que brinda la informacin,
seguido por posibles respuestas (alternativas) a tal enunciado; de las cuales es posible
elegir la que se estima correcta. Pueden presentar tres, cuatro y cinco alternativas. Los
ms usados son los tems de cuatro o de cinco alternativas, pues al presentar un azar
menor de respuestas hacen ms difcil el test. Por lo mismo, aumenta la desviacin y
con ello la discriminacin y la confiabilidad.
Forma de presentacin:
a) distractor
b) distractor
c) alternativa correcta (por ejemplo)
d) distractor
e) distractor
De todas las alternativas brindadas, siempre debe existir slo una correcta. El resto,
denominadas distractores, deben distraer la atencin del alumno que no sabe bien.
Deben ser o parecer como correctas, de tal suerte de habilitar la excelencia del tem
completo. La plausibilidad de eleccin de dichos distractores slo se conocer una
vez que se haya realizado el anlisis de tem (proceso posterior a la aplicacin del
test)
Tal como cualquier tipo de tem objetivo, los temes de SM deben ajustarse a la regla
fundamental y a los seis criterios generales de elaboracin (contenidos en la pgina
39) y, a las sugerencias N 1, 2, 3, 5, 7, 8, 11, 12, 13, 14 de los tems V F ( pginas
41 a 45). Sin embargo estos tems tienen tambin algunas caractersticas especiales
que aconsejan los siguientes criterios de elaboracin:
para la persona que no sabe; o, que slo sabe o domina ligeramente los
objetivos educativos contrastables.
Ejemplos malos:
Ejemplo malo:
6. La
6. Las palabras que se repiten en todas las alternativas deben formar parte del
enunciado.
Ejemplo malo:
- Para que un cohete escape del campo de atraccin terrestre, deber superar:
a) Una velocidad de 8,2 Km. por hora.
b) Una velocidad de 9,2 Km. por hora.
c) Una velocidad de 14,2 Km. por hora.
d) Una velocidad de 11,2 Km. por hora.
Ejemplos malos:
Ejemplos malos:
Este tipo de tem es una variacin del tipo de tem de seleccin mltiple; por ello,
presenta sus mismas ventajas y sus mismas desventajas; y, debe utilizar criterios de
elaboracin parecidos.
Este tipo de tem presenta adems de lo mencionado dos ventajas por sobre los
temes de Seleccin Mltiple:
Por el hecho de que se emplean generalmente para medir o estimar el
conocimiento de causas y efectos, de las funciones, de los usos mltiples, y la
capacidad para aplicar e interpretar; como tambin anlisis de elementos y
relaciones, esta forma de pregunta presenta mayor dificultad para los alumnos
ya que, adems de identificar lo correcto, exige relacin.
Al ser ms difcil por lo anteriormente expuesto, discrimina mejor a los
alumnos.
Forma de Presentacin:
x.- _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _
_ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ ______ _ _ _ _ _ _ _ _ _
I ___________________________
II ____________________________
III ____________________________
IV ____________________________
V ____________________________
a) Slo I
b) Slo II
c) I-II-III
d) II-IV-V
d. Multiitem
Este tipo de tem es otra variacin del tem SM. Se caracteriza por presentar un
prrafo o un texto particular y luego adjuntar bajo ste una serie de tems
pertinentes (de ah su nombre). Esta es la nica diferencia. En forma son iguales a los
SM; se diferencian en la presentacin del estmulo para estimar el aprendizaje. En los
temes SM el alumno contesta por el recuerdo de su aprendizaje logrado; en cambio,
en el Multiitem, el alumno contesta por el estmulo que se le da recin en la prueba.
Este tipo de tem se usa mucho para medir comprensin de lectura (traduccin,
interpretacin y extrapolacin), aplicacin y anlisis.
Presenta las mismas ventajas y desventajas que los tems SM; adems se debe
elaborar de acuerdo a sus mismos criterios de construccin. Presentan una diferencia
en cuanto a la cantidad de informacin que se debe manejar. Por ello resulta bastante
cansador para el alumno, pues adems del tiempo de lectura y comprensin ste
debe establecer relaciones de informacin que presenta el prrafo; informacin que
muy corrientemente es olvidada, incluso, antes de terminar de leer por primera vez
parte del prrafo o el prrafo total.
Forma de Presentacin:
Prrafo
x.- _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ __
____________________________________________
a) _______________________________
b) _______________________________
c) _______________________________
d) _______________________________
Se agregan varios tems de idntica forma que los SM. Generalmente entre 3 y 10
tems.
e. temes Pareados
Este tipo de tem tambin es una variacin de los tems SM. Consiste en la
representacin de dos columnas, en una de ellas la de la izquierda se presentan los
tems, y en la columna de la derecha estn las alternativas. Piden del alumno la
relacin, pertinencia, o aparejamiento entre algn tem de la columna izquierda, y
alguna alternativa de la columna derecha. Este tipo de tem se usa mucho para medir
conocimiento, informacin tal como: recuerdo de fechas, lugares, nombres, autores de
libros, lxico, identificacin y traduccin simblica (mediante dibujos). Sus fallas
ms importantes son las siguientes:
Forma de presentacin
Columna A Columna B
1.- _ _ _ _ _ _ _ _ _ _ _ _ a) _ _ _ _ _ _ _ _ _
2.- _ _ _ _ _ _ _ _ _ _ _ _ b) _ _ _ _ _ _ _ _ _
3.- _ _ _ _ _ _ _ _ _ _ _ _ c) _ _ _ _ _ _ _ _ _
4.- _ _ _ _ _ _ _ _ _ _ _ _ d) _ _ _ _ _ _ _ _ _
e) _ _ _ _ _ _ _ _ _
f) _ _ _ _ _ _ _ _ _
g) _ _ _ _ _ _ _ _ _
h) _ _ _ _ _ _ _ _ _
2 Procure que el conjunto de temes sea relativamente breve. Razn: menor carga
de lectura para el alumno que est contestando.
3 Si las dos columnas difieren en extensin de los enunciados, los alumnos deben
elegir las respuestas en la columna que lleva la menor carga de lectura. Razn:
la columna de respuestas ser leda varias veces por el alumno. Por lo mismo
ahorrar tiempo si los enunciados son breves.
HOJA DE RESPUESTAS
Para contestar el Test Objetivo de rendimiento escolar es aconsejable usar una Hoja de
Respuestas en la cual el alumno pueda mostrar su aprendizaje real logrado mediante las
marcas que haga sobre las alternativas que estima correctas para cada tem del test. La
razn principal de la existencia de la Hoja de Respuestas es de ndole econmica. Si los
alumnos marcasen los cuadernillos de preguntas, inutilizaran el instrumento, encareciendo
excesivamente el costo del material. Adems, el tiempo de marca es tan nfimo que los
alumnos no gastan ms del necesario al contestar, habilitando por lo tanto la estimacin del
tiempo posible de respuesta.
b) Las respuestas correctas deben ser asignadas al azar. No debe existir una estructura
fija de respuesta: escalas, conglomerados, todas a o d, etc.
d) Coloque instrucciones que requieran datos personales de los alumnos que estn
contestando (nombre, curso, fecha, profesor, etc.), de otra manera no identificar a
quien emite las respuestas.
HOJA DE RESPUESTAS.
VERDADERO FALSO.
1. V F 18. a b c d
2. V F 19. a b c d
3. V F 20. a b c d
4. V F 21. a b c d
5. V F 22. a b c d
6. V F 23. a b c d
7. V F 24. a b c d
8. V F 25. a b c d
9. V F 26. a b c d
10. V F 27. a b c d
11. V F 28. a b c d
12. V F 29. a b c d
30. a b c d
31. a b c d
SELECCIN MLTIPLE. 32. a b c d
33. a b c d
13. a b c d 34. a b c d
14. a b c d 35. a b c d
15. a b c d 36. a b c d
16. a b c d 37. a b c d
17. a b c d
38. a b c d
39. a b c d
T E M ES O M B D
40. a b c d
VF
Nombre:
___________________ SM
T
Departamento de Educacin, Facultad de Educacin y Letras, Universidad de Chile.
P
Diseo, Elaboracin y Aplicacin de Tests Educativos Cognoscitivos 61
Curso:
___________________
Fecha:
___________________
PLANTILLA DE CORRECCIN
Es la plantilla de correccin la que hace que este test sea objetivo. Consiste en una Hoja de
Respuestas igual a la entregada a los alumnos para contestar a la que se le han hecho
algunos sacados y pequeos orificios. Para que una Hoja de Respuestas se convierta en una
plantilla de correccin, debe tener:
b) Debe tener dos orificios. Uno de ellos sobre el nmero 1 del primer tem; y, otro sobre
el ltimo nmero del tem que contenga el test. Razn: a veces las mquinas
reproductoras de informacin no reproducen la misma informacin a la misma altura
de todos los papeles. Por ello, siempre debajo del orificio primero debe aparecer el
nmero 1 de la hoja de respuestas del alumno; y el ltimo nmero de la hoja de
respuestas del alumno bajo de el ltimo orificio. As, usted puede corregir
tranquilamente.
c) Adems del sacado de los dos orificios, la plantilla de correccin debe tener tantos
orificios como preguntas contenga la prueba. Cada orificio se hace en la alternativa
correcta de cada tem. Al respecto, y por muy domstico y artesanal que parezca,
cuando haga su Hoja de Repuestas cuide de separar adecuadamente las alternativas;
de no hacerlo un orificio puede contener ms de una alternativa. Igual, recomendamos
hacer los orificios con sacabocados, de esta manera se evita la poca uniformidad y el
peligro de no abarcar ms que el tem en cuestin; riesgo, que sin duda se corre al
hacer los orificios o con un cuchillo cartonero, una hoja de afeitar, o con un cigarrillo
encendido.
Para corregir un Test Objetivo usted debe tener: las Hojas de Respuestas de los alumnos
contestadas luego de haber aplicado el test, y la Plantilla de Correccin. Para corregir, le
recomendamos el siguiente procedimiento:
1) Antes de aplicar la plantilla sobre las Hojas de Respuestas contestadas de los alumnos:
a) Tarje una lnea horizontal verde a lo largo de todas alternativas que presente el tem
omitido y luego anote la cantidad en el cuadro de marcacin.
Ejemplo de Omitidas:
V F a b c d
V F a b c d
V F a b c d
b) Tarje una lnea horizontal roja a lo largo de todas las alternativas de aquellos
temes que fueron respondidos con ms de una lnea oblicua. Sern considerados
incorrectos, fraudulentos o con engao. No se anota la cantidad en el cuadro de
marcacin an, sino hasta conocer las malas o incorrectas de aprendizaje para
sumarlas y anotarlas conjuntamente.
V F a b c d
a b c d
a) Marque las malas de aprendizaje. Ser considerada mala de aprendizaje toda pregunta
cuya preferencia no coincida con el orificio que traduce la respuesta correcta para tal
tem. Las malas de aprendizaje se marcan con una lnea oblicua roja en el orificio de
la respuesta correcta. Toda vez que bajo el orificio de la pregunta haya un espacio en
blanco o una cruz, est ser considerada mala.
b) Contabilice tanto las malas con fraude, como las malas de aprendizaje y anote la
cantidad en el cuadro de marcacin (columna M = Malas),
Respecto del uso de los colores, ste representa una convencin muy til para entender
visualmente el anlisis de temes; como principalmente, para ayudarle a corregir ordenada
y correctamente. Si usted va a respetar esta convencin , solicite a sus alumnos usen
lpiz azul o negro de pasta para responder. El uso de lpiz grafito y goma habilitan ms
an la posibilidad de jugar con el azar de respuesta.
d) Hacer el Descuento:
D
M
K 1
en donde: D = Descuento
= Suma de, Sumatoria
M= Malas
K = Nmero de Alternativas que contiene cada tem del test.
K1 = Representa el monto de azar que tolera el test.
P B C
en donde: P = Puntaje corregido total del test objetivo
B = Total de buenas o puntaje bruto
D = Total de descuento del test objetivo
REFERENCIAS
ADKINS, W. DOROTHY.
Elaboracin de Tests Trillas, Mxico, 1973.
BLANCO, GUILLERMO,
El B.H. de V. y los test artculo aparecido en la Revista Ercilla N 1786 del 16
de Septiembre de 1969.
BLOOM, S. BENJAMIN,
Taxonomy of Educational Objectives: The Classification of Educational Goals:
Handbook 1, Cognitive Domain, David McKay & Co. New York, 1969.
GAGNE, M. ROBERT,
Los Dominios del Aprendizaje (traduccin), Florida State University, Center for
Educational Technology, Tallahassee, Florida, 1974.
GAGNE, M. ROBERT,
Condition of Learning (3rd ed.) Holt, Rinehart & Winston, New York, 1977
LAFOURCADE, PEDRO.
Evaluacin de los Aprendizajes. Kapelusz, Buenos Aires, 1973.
LEMUS, A. LUIS.
Evaluacin del Rendimiento Escolar. Kapelusz, Buenos Aires, 1974.
LINDEMAN, RICHARD.
Tratado de Medicin Educacional. Paids, Buenos Aires, 1971.
MAGER, F. ROBERT.
Preparing Instructional Objectives (2nd ed.). Fearon Publishers, Inc., Belmont,
California, 1975.
MAGNUSSON, DAVID.
Teora de los Tests. Trillas, Mxico, 1972.
METFESSEL, et al.,
Tablas de Relaciones entre Dominios de Aprendizaje y Verbos Operativos
(Extracto Traduccin; C.P.E.I.P. , Lo Barnechea, Chile), 1969.
PIZARRO, S. RAUL,
Objetivos Educacionales: algunos alcances tericos Monografa
n 1, Departamento Educacin, Universidad de Chile, 1977.
PIZARRO, S. RAUL,
Puntajes Mnimos de Aprendizaje para Tests Objetivos de Rendimiento Escolar
Departamento Educacin, Universidad de Chile, 1978.
PIZARRO, S. RAUL,
Medicin y Evaluacin Educacional: aspectos fundamentales s. e., 1978.
SACHS, A. GEORGIA.
Medicin y Evaluacin en Educacin, Psicologa, y Guidance. Herder,
Barcelona, 1970.
TARTARINI, ELIANA.
Evaluacin Escolar y Elementos de Estadstica Aplicada. Universitaria, Santiago,
Chile, 1971.
TYLER, W. RALPH.
Principios Bsicos del Curriculum y del Aprendizaje. (Traduccin: Mario Leyton S.)
En Planeamiento Educacional, Mario Leyton Soto, Universitaria, Santiago de Chile,
1972.
AUTO-EVALUACION
Usted deber seleccionar, para cada tem, la respuesta correcta. Recuerde que cada tem
tiene una sola respuesta correcta. Elija la que estime correcta. Como se pretende que llegue
a la alternativa correcta por aprendizaje, evite la adivinacin.
En la ltima pgina estn las respuestas correctas de los tems presentados. Verifique en qu
parte de la unidad est fracasando y lea nuevamente la seccin pertinente. Slo una vez que
usted conteste correctamente todas las preguntas, puede leer la prxima unidad: Anlisis y
Clasificacin de Puntajes; de otro modo su aprendizaje puede resultar poco consistente.
Son correctas:
a) I - III - IV
b) I - II - III
c) II - III - IV
d) I - II - III - IV
6. Las pruebas educativas tienen ________ cuando miden aquello que se desea medir.
a) Confiabilidad.
b) Validez.
c) Representatividad.
d) Objetividad.
Es (son) correcta(s):
a) Slo I
b) I - II - III
c) I - II
d) Slo II
12. El reemplazo de las pruebas reales por las escritas, se debi principalmente a que
las segundas:
I. Presentan un tiempo posible uniforme de respuesta.
II. Incluyen las mismas preguntas para todos los alumnos.
III. Permiten el registro total de las respuestas.
IV. Habilitan comparaciones de respuesta de igual base.
Son correctas:
a) I - II
b) I - II - IV
c) II - III - IV
d) I - II - III - IV
15. Las nicas conductas que miden las pruebas de ensayo, y que no pueden medir las
pruebas objetivas, pertenecen a la categora:
a) Aplicacin.
b) Anlisis.
c) Sntesis.
d) Evaluacin.
17. De los siguientes tipos de tems objetivos, seleccione el que presenta mayor azar:
a) Verdadero Falso.
b) Seleccin Mltiple.
c) Pareados.
d) Multitem.
18. La principal falla que presenta esta prueba objetiva radica en:
Para contestar los tems N 19, 20 y 21, corrija la Hoja de Respuestas contestada (ver
pgina ) con la plantilla de correccin adjuntada (ver pgina ).
c) 34
d) 35
Nota: Una vez que haya contestado los tems de la auto evaluacin, pase a la pgina
siguiente en donde usted encontrar las respuestas correctas para cada uno de ellos.
Respuestas correctas:
1. a 12. d
2. b 13. a
3. c 14. b
4. d 15. c
5. a 16. d
6. b 17. a
7. c 18. b
8. d 19. c
9. a 20. d
10. b 21. a
11. c
Si usted tiene algn error, debe verificar la seccin de la unidad donde est fallando. Para
identificar la Laguna de Aprendizaje relacione el o los tems con sus respectivos
objetivos. Hecho lo anterior, lea la parte pertinente. Posteriormente vuelva a responder toda
la seccin de auto evaluacin. Compare sus dos resultados. Slo una vez que usted haya
dominado la unidad, le sugerimos leer la prxima unidad: Anlisis y Clasificacin de
Puntajes
R. P. S / S. C. L.
1979.