Operante Discriminada PDF

La Naturaleza de la Operante Discriminada 1
Operantes Discriminadas: Control de Estímulos
Seminario Interactum de Análisis del Comportamiento

UNIVERSIDAD DE SONORA
OPERANTES DISCRIMINADAS: CONTROL DE ESTÍMULO 1
El Latín habere, tener, y capere, tomar o asir, pueden rastrearse a raíces Indo-Europeas íntimamente
relacionadas. Habere es un ancestro de comportamiento, hábito, e inhibir. Capere condujo a concepto y
percepción, términos relevantes de las clases de estímulo; de tal manera, estas palabras y
comportamiento son familiares lejanos. No existen ligaduras obvias entre diferenciación e inducción,
aplicadas a clases de respuestas, y discriminación y generalización, aplicadas a clases de estímulos.
Diferenciación, del Latín dis-, aparte, además de ferre, cargar, está relacionado a través del Indo-
Europeo bher-, cargar o sobrellevar, a nacimiento, transferir, y metáfora (mas no a interferir). Inducción,
del Latín in-, dentro, además de ducere, conducir, está relacionado a través del Indo-Europeo deuk,
arrastrar o conducir, a duque, educar, y conducta. Discriminación, del Latín dis-, además de crimen,
juicio, está relacionado a través del Indo-Europeo skeri-, cortar o separar, a crimen, describir, y criterio. Y
generalización, del Latín genere, producir o causar, está relacionado a través del Indo-Europeo gen-, dar
a luz o reproducir, a ingenioso, amable, y naturaleza.
Las respuestas pueden ser reforzadas diferencialmente no sólo con respecto a las dimensiones de los
estímulos en presencia de los cuales ocurren. Por ejemplo, las respuestas a la palanca de una rata en
presencia de luz son diferentes de las respuestas a la palanca en la oscuridad, y el reforzamiento puede
ser dispuesto para las respuestas a la palanca en presencia de la luz mas no en su ausencia. De manera
similar, los picoteos a la tecla de un pichón en luz verde son diferentes de sus picoteos en luz roja. Si los
picoteos son reforzados solamente en verde, decimos que el reforzamiento de los picoteos está
correlacionado con verde. Una clase de respuesta creada por tal reforzamiento diferencial con respecto a
las propiedades de un estímulo se denomina operante discriminada.
Las operantes discriminadas son un aspecto permeante del comportamiento. Cuando manejas, procedes
a través de una intersección si la luz del semáforo es verde pero no si es roja. Cuando hablas con
alguien, lo que dices se ve afectado por tales factores como lo que la otra persona acaba de decir, la
postura del otro y su expresión facial, y el contexto de la conversación. Muchos ejemplos de
reforzamiento anteriores incluyeron control discriminativo de la respuesta. Al discutir el aprendizaje de la
rata de un laberinto, enfatizamos el incremento de la elección de las vueltas correctas, pero la rata que
fallaba en discriminar el lugar apropiado en el cual dar vuelta a la derecha o a la izquierda golpearía
repetidamente las paredes al moverse a través del laberinto y difícilmente podría dominar el laberinto
como un todo.
Los estímulos discriminativos corresponden a aquellos coloquialmente llamados señales o indicadores.

No elicitan respuestas. En su lugar, presentan la ocasión en la cual las respuestas tienen consecuencias
1
Catania, Ch. (1992). Learning. Englewood Cliffs: Prentice-Hall (págs. 129-156).
y se dice que ocasionan respuestas (cf. el concepto de asequibilidad; Gibson, 1979). Un ejemplo del
desarrollo del control del estímulo, el control de la respuesta por un estímulo discriminativo, se muestra
en la Figura 7-1 (Herrick, Myers, & Korotkin, 1959). Las ratas presionaron una palanca en presencia y
ausencia alternada de luz. Cuando la luz estaba encendida, las respuestas a la palanca eran
ocasionalmente reforzados con alimento. Cuando no estaba encendida, no eran reforzadas. La anotación
para el estímulo correlacionado con reforzamiento es ED por estímulo discriminativo o E+ por estímulo
positivo; aquélla para el correlacionado con no reforzamiento o extinción es E^, también por estímulo
discriminativo (^ es delta, la letra d Griega), o E- por estímulo negativo (estrictamente, E0 es más
apropiado para denotar la ausencia de un estímulo, pero E- es el uso más común).
En el procedimiento de la Figura 7-1, luz y oscuridad se alternaron de manera irregular; cuando estaba
encendida, la lámpara permanecía encendida por períodos de 5 a 30 segundos. Las respuestas a la
palanca eran reforzadas de acuerdo a un programa de intervalo-variable o IV de reforzamiento: En
promedio, sólo una respuesta era reforzada cada 30 segundos mientras la luz estaba encendida. Las
características importantes de este programa son que mantiene una tasa de respuesta moderada y
relativamente constante y que los lapsos de tiempo variables entre reforzamientos sucesivos convierten
el lapso transcurrido desde el último reforzamiento en un predictor no confiable de cuándo la siguiente
respuesta será reforzada. En estas circunstancias, si la rata presiona más en la luz que en la oscuridad la
luz puede considerarse como el estímulo controlador; tal diferencia en la tasa no podría haber dependido
del tiempo transcurrido entre cambios de estímulo o del tiempo entre reforzadores porque el ciclo
temporal de esos eventos era no sistemático.
A lo largo de las sesiones, las respuestas se incrementaron en presencia de la luz pero decreció en su
ausencia. Tales incrementos con frecuencia acompañan dichas discriminaciones (contraste conductual;
ver Capítulo 8). La Figura 7-1 también muestra cambios en un índice de discriminación, la respuesta en
presencia de luz como un porcentaje del total de respuestas. El índice decreció a lo largo de las sesiones.
Para describir este resultado podemos decir que las respuestas en presencia de la luz era una operante
discriminada, que la luz funcionó como estímulo discriminativo para dichas respuestas, o que estaban
bajo el control del estímulo de la luz.
Sección A. La Naturaleza de las Operantes Discriminadas.
Podemos ilustrar algunas propiedades de las operantes discriminadas mediante un ejemplo hipotético
relacionado con la Figura 6-1. De nuevo, una rata se encuentra en una cámara con una rendija en una
pared, pero en esta ocasión la rata no puede meter su nariz en la rendija. En su lugar, la rendija está
cubierta por una tira de plástico transparente que puede ser encendido por una serie de 15 lámparas
detrás de ella. En otras palabras, las lámparas presentan una dimensión de estímulo análoga a la
dimensión de la respuesta de la Figura 6-1. Una palanca se encuentra centrada debajo de la rendija y en
la pared opuesta se encuentra un dispensador de alimento. Ahora encendemos las lámparas detrás de la
tira en un orden irregular y registramos el palanqueo que ocurre en presencia de cada una de ellas. Si no
reforzamos las respuestas a la palanca, son poco frecuentes y no muestran relación sistemática con la
porción de la tira que está encendida. De hecho, los datos pueden ser muy parecidos a aquellos en A de
la Figura 6-1, con la gran diferencia de que el eje x representa la posición del estímulo en lugar de la
posición de la respuesta.
FIGURA 7.1 Respuestas a la palanca en presencia y ausencia de la luz. El estímulo discriminativo (luz)
estuvo correlacionado con un programa de reforzamiento de intervalo-variable (IV) y la no presencia de la
luz con extinción. El índice de la discriminación es la proporción de respuestas totales en presencia de la
luz (el 100 porciento de la tasa de respuestas al ED divido por la suma del ED más el E^). Los datos
representan la tasa promedio de 8 ratas (de Herrick, Myers & Korotkin, 1959; Figura 2).
En este punto, reforzamos las respuestas ante la luz encendida solamente en las posiciones 9, 10, 11, o
12; con luz en cualquier otra posición, las respuestas no son reforzadas. El efecto inicial del reforzamiento
es muy parecido a aquel en B de la Figura 6-1: un incremento en la respuesta a lo largo de todas las
posiciones. El efecto no se restringe a estímulos en las posiciones correlacionadas con reforzamiento; en
su lugar, se extiende a otras posiciones. La extensión del efecto de reforzamiento en presencia de un
estímulo a otros estímulos no correlacionados con reforzamiento se denomina generalización. En el
ejemplo, el reforzamiento de respuestas cuando las luces 9 a 12 están encendidas afecta la respuesta en
presencia de luces en todas las otras posiciones. Este ejemplo difiere del original principalmente en la

dimensión correlacionada con reforzamiento: el Capítulo 6 se ocupó de una dimensión de la respuesta,

pero ahora nos ocuparemos de una dimensión del estímulo.
Supongamos que continuamos con reforzamiento diferencial respecto a la localización del estímulo,
reforzando respuestas solamente cuando las posiciones 9 a 12 están encendidas. La respuesta se
incrementa gradualmente cuando estas posiciones se encuentran encendidas y decrece cuando otras
posiciones se encuentran encendidas. Nuevamente, los efectos son parecidos a aquellos de la Figura 6-
1, en C, D, y E. Eventualmente la mayoría de las respuestas ocurren con luz en las posiciones
correlacionadas con reforzamiento, tal como en E, y se puede llegar a un punto en el cual, aún cuando
ciertas respuestas todavía ocurran durante luz en otras posiciones, la distribución de las respuestas no
cambia mucho con reforzamiento diferencial continuado.
En este ejemplo, los estímulos que ocasionaron la respuesta llegaron a conformarse muy de cerca con la
clase de estímulos correlacionados con reforzamiento. Este proceso se denomina discriminación, y la
respuesta controlada de esta manera por estímulos se dice que es discriminada. El reforzamiento
diferencial con respecto a estímulos creó una clase de respuesta definida por los estímulos en presencia
de los cuales las respuestas ocurrieron. ¿Pero qué sucede con las respuestas en la presencia de
estímulos fuera de los límites correlacionados con reforzamiento (por ejemplo, las posiciones 6, 7, y 8, o
13, 14, y 15)? De acuerdo a una interpretación estricta, no cuentan como miembros de la clase de
operante discriminada; son consideradas en términos de la generalización. Pero la operación del
reforzamiento diferencial generó respuestas tanto dentro como fuera de estos límites, así que estas
respuestas son parte de una distribución continua.
El propósito es el mismo que el del Capítulo 6. Debemos reconocer dos clases de estímulos: Una es la
clase correlacionada con una contingencia de reforzamiento; la otra es la clase en presencia de la cual la
respuesta ocurre. Nuestro interés no se encuentra en una sola clase sino en la correspondencia entre
ellas. La discusión es un paralelo cercano a aquella de la diferenciación e inducción en el Capítulo 6. Es
apropiado, porque un estímulo en cuya presencia una respuesta ocurre es otra propiedad de esa
respuesta, así como su fuerza o su duración o su topografía. ¿Por qué entonces hablamos de
reforzamiento diferencial respecto a las propiedades de la respuesta en términos de diferenciación e
inducción, mientras que hablamos de reforzamiento diferencial con respecto a las propiedades del
estímulo en términos de discriminación y generalización?
Un factor metodológico puede ser crucial para la distinción. Cuando estudiamos reforzamiento diferencial
con respecto a las propiedades de la respuesta, registramos las respuestas en clases diferentes, pero
aparte de acomodar contingencias no existe mucho más qué hacer con ellas. Si vemos una rata a punto
de meter su nariz en la posición 7 de la rendija, no podemos prevenir apropiadamente la respuesta aún si
la rata ha respondido muchas más ocasiones ahí que en otra parte. Supongamos, sin embargo, que
estuviésemos trabajando con propiedades del estímulo. Podríamos presentar las luces igualmente
frecuentes en cada posición, o podríamos presentar luces en algunas posiciones pero no en otras de tal
manera que la rata nunca tuviese una oportunidad de presionar la palanca en presencia de algunos
estímulos. Tales casos justifican el decir que los estímulos en procedimientos de discriminación
presentan la ocasión para las respuestas: Cuando una clase de respuestas es definida por la presencia
de un estímulo, las respuestas en la clase no pueden ocurrir cuando el estímulo está ausente.
Aún esta distinción metodológica tiene excepciones. Por ejemplo, considere el reforzamiento diferencial
de tasas bajas ( el programa RDB; Capítulo 6). Si el picoteo de un pichón es reforzado sólo después de al
menos 5 segundos de no picoteos, el pichón podrá llegar a espaciar sus picoteos cercano a un lapso de
5 segundos. Discutimos este comportamiento en términos de la diferenciación de una operante compleja
consistente en una pausa más un picoteo. Podríamos en su lugar concebir la duración de la pausa como
una propiedad del estímulo y argumentar que el comportamiento debería ser tratado como una
discriminación basada en tiempo transcurrido desde el último picoteo. En este caso, de hecho, los
vocabularios son intercambiables. Si hablamos de diferenciación e inducción o de discriminación y
generalización, la operación subyacente es reforzamiento diferencial. Tanto la diferenciación como la
discriminación involucran correspondencias entre las dimensiones sobre las que el reforzamiento
diferencial está basado y las dimensiones del comportamiento resultante. Sin embargo, sostendremos la
diferencia establecida entre los vocabularios de las propiedades de la respuesta y las propiedades del
estímulo, porque estos vocabularios poseen una base extensiva y ampliamente aceptada.
EL PROBLEMA DE LA ATENCIÓN.
Al hablar de la correspondencia entre los estímulos con los cuales las contingencias de reforzamiento
están correlacionadas y aquellos a los cuales el organismo responde, hablamos en términos de la
dimensión del estímulo seleccionada por el experimentador. Pero los estímulos poseen varias
propiedades, y no existen garantías de que el organismo responderá sólo a aquellas propiedades
seleccionadas. En la diferenciación, las respuestas de una rata podrían tener una forma relativamente
constante aún si la fuerza fuese la base para el reforzamiento diferencial. Por ejemplo, la rata podría
confiablemente presionar la palanca con su pata izquierda aún cuando esta propiedad no es crítica a si la
respuesta es reforzada. De manera similar, en la discriminación una rata podría responder con base en la
intensidad de un estímulo visual aún cuando el reforzamiento diferencial está basado sólo en su figura.
(Las propiedades del estímulo a las cuales es probable que un organismo responda son algunas veces
denominados salientes, pero la saliencia no es propiedad de un estímulo; es una propiedad del
comportamiento de un organismo con respecto al estímulo).
El concepto de atención surge de la respuesta discriminada a propiedades de los estímulos. Considere

un pichón cuyos picoteos de tecla son ocasionalmente reforzados con alimento. Una de dos
combinaciones de estímulos es presentada en la tecla: un triángulo sobre un fondo rojo o un círculo sobre
un fondo verde. Después de 3 minutos de triángulo sobre rojo, el siguiente picoteo en presencia de este
estímulo es reforzado; después de 3 minutos de círculo sobre verde, el estímulo se retira sin
reforzamiento. El arreglo durante triángulo sobre rojo se denomina programa de intervalo fijo o IF de
reforzamiento; el arreglo durante círculo sobre verde es extinción. El programa de intervalo fijo se
examina en el Capítulo 8. Por ahora, es suficiente hacer notar que este programa generalmente mantiene
respuestas que incrementan en tasa con el transcurso del tiempo en el intervalo y no la tasa
relativamente estable normalmente sostenida por un programa de intervalo variable. Si cada picoteo
durante triángulo sobre rojo produjese un reforzador, entonces las entregas mismas podrían adquirir
funciones discriminativas. No debemos preocuparnos acerca de tales efectos con reforzamiento de IF
porque ningún picoteo es reforzado sino hasta que el intervalo finaliza.
Los datos de dos pichones se muestran en la Figura 7-2 (Reynolds, 1961a). Las g´raficas de la izquierda
muestran tasas de picoteo durante cada estímulo compuesto después de 18 horas de entrenamiento.
Ambos pichones emitieron más de 40 picoteos por minuto durante triángulo sobre rojo pero picotearon
con tasas relativamente bajas durante círculo sobre verde. En una prueba sin reforzamiento, los
elementos de cada compuesto fueron presentados por separado. Para el pichón 105, casi todo el picoteo
ocurrió durante el triángulo; el rojo, el color de fondo correlacionado con reforzamiento, ocasionó muy
pocas más respuestas que el círculo o el verde, los elementos previamente correlacionados con
extinción. Para el pichón 107, por otra parte, casi todo el picoteo ocurrió durante rojo; aún cuando el
triángulo había estado correlacionado con reforzamiento durante el entrenamiento, por sí solo ocasionó
aún menos picoteo que el círculo o el verde. El pichón 105 estaba atendiendo a la forma y no al color, y el
pichón 107 estaba atendiendo al color y no a la forma. Durante el entrenamiento, tanto el color como la
forma estaban correlacionados de la misma manera con reforzamiento. Sólo al examinar por separado
los efectos de los elementos pudimos señalar cuáles fueron sus funciones discriminativas.
La atención no es solamente un ejemplo de la generalización. Para el pichón 105, la respuesta se

generalizó de triángulo sobre rojo a triángulo sin un fondo de color pero no a rojo sin un triángulo.
Generalmente hablamos de la atención no como una respuesta a estímulos particulares sino como
atención a dimensiones de un estímulo (poner atención significa escuchar todo lo que se dice y no
solamente a ciertas partes). Decimos que el pichón 105 atendió a forma y no a color porque la respuesta
discriminada ocurrió con cambios en forma pero no con cambios en color. Cuando los estímulos son
discriminados a lo largo de una dimensión de estímulo pero no de otra, podemos decir que el organismo
está atendiendo a la primera dimensión mas no a la segunda.

Figura 7.2 Respuestas a la tecla de dos pichones en donde se correlacionó el triangulo rojo con
reforzamiento y el círculo verde con extinción (izquierda: entrenamiento), durante la fase de prueba
(extinción) los componentes del estímulo fueron presentados por separado (derecha: prueba de
atención). El pichón 105 respondió a la forma pero no al color; el pichón 107 respondió al color pero no a
la forma (de Reynolds, 1961a; Figura 1).
Una vez que un organismo ha atendido a algunas propiedades del estímulo en una situación, es posible
que atienda a esas propiedades en situaciones novedosas (Lawrence, 1949). Podemos también modificar
la posibilidad de que un organismo atienda a propiedades del estímulo simplemente modificando la
manera en que el reforzamiento está correlacionado con ellas (Johnson & Cumming, 1968). En la fase de
entrenamiento de la Figura 7-2, forma y color estaban correlacionadas de igual manera con el
reforzamiento. Por esta razón, el experimento era especialmente adecuado para demostrar algunas
propiedades de la atención. Pero si nuestro interés mayor fuese la discriminación de forma en el pichón,
podríamos tornar irrelevante el color y correlacionar solamente algunas formas pero no otras con el
reforzamiento.
APRENDIZAJE DE LUGAR VS APRENDIZAJE DE RESPUESTA.
Los temas precedentes están indirectamente relacionados con una constante controversia en psicología,
acerca de aprendizaje de lugar vs. Aprendizaje de respuesta (Restle, 1957). La respuesta de moverse de
un lugar a otro ha tenido un lugar privilegiado en análisis del comportamiento (Olton, 1979). Dirigirse
hacia el alimento no es lo mismo que producir alimento mientras se permanece en el mismo lugar. Una
diferencia importante entre los dos casos es que el ambiente cambia más drásticamente cuando nos
movemos a un lugar nuevo que cuando introducimos un estímulo nuevo en nuestro mismo lugar. Los
humanos en particular han encontrado maneras de sustituir otras respuestas para la locomoción
ordinaria: para dirigirse a lugares, oprimimos los pedales de la gasolina, giramos volantes, oprimimos
botones de elevador, y nos paramos en escaleras eléctricas o pasillos en movimiento. Aún más, el
movimiento produce cambios continuos en el ambiente, mientras que las secuencias de otras respuestas
pueden no producir cambio sino hasta que la secuencia se ha completado. Más allá de estas diferencias,
entonces, ¿Importa si el organismo se traslada a un nuevo lugar o produce estímulos nuevos desde
donde se encuentra?
Tales cuestiones estaban implícitas en la controversia sobre el aprendizaje de lugar vs. el aprendizaje de
respuesta. Podemos diferenciar los giros a la derecha de una rata en el punto apropiado de un laberinto T
al reforzar los giros a la derecha pero no a la izquierda. Podemos entonces preguntarnos si la respuesta
de la rata está basada en las dimensiones de respuesta (movimientos a la derecha opuestos a
movimientos a la izquierda) o en las dimensiones del estímulo (movimientos hacia un lugar particular,
independientemente de la dirección desde la que la rata se aproxima). Por ejemplo, supongamos que el
brazo derecho del laberinto T apunta hacia la pared este de un laboratorio con ventana más brillante. La
rata podría aprender los giros a la derecha o podría aprender a correr hacia la ventana. Podríamos
evaluar estas alternativas girando el laberinto T de tal manera que el brazo derecho apunte al oeste y la
rata ahora se aproxima al punto apropiado desde el norte. Si la rata gira a la izquierda hacia la ventana,
muestra aprendizaje de lugar: se aproxima al mismo lugar, aún si al hacerlo gira en una dirección
diferente. La cuestión es si la rata ha aprendido giros derechos vs. Izquierdos o giros al este vs. Oeste.
El desempeño de la rata depende en gran medida de los estímulos disponibles tanto dentro como fuera
del laberinto. El laberinto típico estaba cubierto por una malla o alguna otra cubierta que permitía al
experimentador observar lo que la rata hacía. Si un experimentador puede ver hacia adentro, una rata
puede ver hacia fuera. A pesar de ser corta de vista, la rata típica puede discriminar la dirección general
de las luces y otras características generales de un cuarto.
Mientras los estímulos están disponibles afuera del laberinto, pueden convertirse en la base para los giros
de la rata en una dirección particular. Pero si esos estímulos son eliminados al colocar una cubierta
opaca sobre el laberinto, la dirección en la que el laberinto se encuentra en el cuarto se torna irrelevante y
la rata sólo puede demostrar aprendizaje de respuesta. Por lo tanto, el aprendizaje de lugar o el
aprendizaje de respuesta pueden depender de la preparación del problema que el experimentador haga
para la rata. Al seleccionar cuidadosamente las condiciones, un experimentador puede hacer un
resultado más posible que el otro.
En ambientes naturales, el alimento en un lugar dado no es necesariamente abastecido de nuevo como

lo es en la caja meta de un laberinto de laboratorio. En la conducta de forrajeo, es más probable que un

animal se traslade a un lugar nuevo a que regrese a uno en el que ya ha consumido el alimento
disponible. Una vez más, las propiedades del ambiente a las cuales el organismo atiende puede variar
con límites impuestos por el experimentador (Collier & Rovee-Collier, 1981; Lea, 1979). Por ejemplo,
cuando a una rata le son presentadas sesiones diarias en un equipo en el cual el alimento se encuentra
localizado al final de cada uno de varios pasillos y el alimento no es reabastecido durante la sesión, la
rata aprende a no repetir visitas a los pasillos donde ya ha comido (Olton & Samuelson, 1976). Las
propiedades espaciales de los ambientes son particularmente importantes, pero en circunstancias
apropiadas una rata puede aprender otras propiedades de su ambiente (patrones secuenciales de
magnitudes de reforzadores; Hulse, 1977).
GRADIENTES DE CONTROL DEL ESTÍMULO.
La metodología de los procedimientos de discriminación ponen una carga pesada en el experimentador.

En los procedimientos de diferenciación el organismo determina el orden de las respuestas, pero en los
procedimientos de discriminación el experimentador debe determinar el orden de los estímulos. Si un
experimentador está interesado en algún continuo de estímulo (cierta dimensión a lo largo de la cual los
estímulos pueden variar, tal como intensidad o posición de una luz), pudiese hacer una diferencia si
muchos o pocos estímulos son presentados, o si cada uno es presentado por un tiempo corto o largo, o si
están correlacionados tanto con reforzamiento como con no reforzamiento o solamente con
reforzamiento. Los diferentes arreglos de los estímulos son la base para la investigación en gradientes de
control del estímulo.
Gradientes de generalización.
Si la respuesta es reforzada durante algún estímulo y una propiedad de ese estímulo es entonces
variada, la respuesta dependerá de qué tanto ha cambiado el estímulo. Por ejemplo, si los picoteos de
tecla de un pichón son reforzados cuando la tecla tiene luz amarilla, el pichón continuará picoteando,
aunque generalmente a tasas más y más bajas, mientras la luz es cambiada a naranja y después a roja y
después a violeta. Esto demuestra generalización: los efectos del reforzamiento durante amarillo se
extienden a otros colores.
La Figura 7-3 presenta datos en la generalización de los picoteos de tecla de pichones a tonos de
frecuencia diferente después de que los picoteos fueron reforzados sólo durante un tono de 1000 ciclos
por segundo (Jenkins & Harrison, 1960). En un procedimiento (sin entrenamiento de discriminación), el
tono estaba siempre presente y los picoteos eran reforzados de acuerdo a un programa de intervalo
variable o IV. En un segundo procedimiento (presencia y ausencia de entrenamiento), el tono estaba
algunas veces presente y algunas veces ausente, y los picoteos eran reforzados de acuerdo al programa
de IV sólo durante el tono. Después del entrenamiento, el reforzamiento era retirado y los tonos de otras
frecuencias eran presentados por primera ocasión, al igual que el no tono y el tono original del
entrenamiento; estos estímulos fueron presentados en ocho ocasiones, cada una de ellas en orden
mezclado.
Figura 7.3 Gradiente de generalización como una función del picoteo a la tecla (1000 ciclos por segundo)
posterior al reforzamiento (Arriba: entrenamiento en generalización de 3 pichones) o posterior durante el
reforzamiento ante el tono y extinción en su ausencia (abajo: entrenamiento en presencia-ausencia de 5
pichones). Sin el entrenamiento en discriminación, los gradientes fueron relativamente planos; después
del entrenamiento ante la presencia-ausencia del tono, los pichones respondieron ante el estímulo
discriminativo (ED). (de Jenkins & Harrison, 1960; Figuras 1 y 2).
Para los tres pichones sin entrenamiento en discriminación (Figura 7-3, arriba), ni la frecuencia del tono ni
su presencia o ausencia tuvieron gran efecto en el picoteo. El gradiente de generalización era
relativamente plano o, en otras palabras, el efecto del reforzamiento durante el tono original se extendió
uniformemente a todos los otros estímulos. Para los cinco pichones con entrenamiento en discriminación
(abajo), la frecuencia original produjo tasas de picoteo más altas que cualquier otro; en general, mientras

más cercana la frecuencia original, más alta la tasa de picoteo. No es sorprendente que las tasas bajas
de picoteo ocurrieron en ausencia del tono: la ausencia del tono estaba correlacionada con extinción.
Pero para estos pichones la tasa de respuesta variaba con la frecuencia aún cuando la respuesta
discriminada dependía solamente de la presencia o ausencia del tono y no de su frecuencia. (La forma de
los gradientes de generalización también es afectada por otras variables, tales como nivel de privación o
el programa de reforzamiento durante el entrenamiento; por ejemplo, Hearst, Koresko, & Poppen, 1964)
El pico del gradiente de generalización demostró que después y no antes del entrenamiento de tono vs.
no tono los pichones atendieron a los estímulos auditivos. La atención es el nombre para este tipo de
fenómeno. Ocurre un problema cuando el término aparece como una explicación. Atender a estímulos es
algo que los organismos hacen. Nosotros decidimos decir que un organismo está atendiendo a un
estímulo basados en su comportamiento. Por lo tanto no deberíamos emplear este término, derivado del
comportamiento, para explicar el comportamiento que justificó su uso en primer lugar. (De manera similar,
si decimos que la dimensión de un estímulo es más saliente que otra porque es más probable que los
organismos atiendan a ella, no podemos entonces emplear esta saliencia para explicar su atención.)
Gradientes postdiscriminatorios.
Los gradientes de control del estímulo también pueden ser obtenidos después de la discriminación entre
dos o más estímulos a lo largo de la dimensión. La Figura 7-4 compara tal gradiente de
postdiscriminación con un gradiente de generalización (Hanson, 1959). Para un grupo de pichones
(generalización), los picoteos de tecla durante una sola longitud de onda en la tecla fueron reforzados de
acuerdo a un programa IV; la tasa de picoteo durante ésta y otras longitudes de onda fue después
determinada en extinción. El gradiente tuvo su punto pico en el estímulo de reforzamiento; la tasa de
picoteo decreció a medida que la distancia de este estímulo incrementó.
Para un segundo grupo (postdiscriminación), los picoteos de tecla fueron reforzados de acuerdo a un
programa IV durante la misma longitud de onda que el primer grupo, pero esta longitud de onda fue
alternada con otra durante la cual los picoteos no fueron reforzados (extinción); tal como el primer grupo,
la tasa de picoteo durante esta y otras longitudes de onda fue entonces determinada por extinción. En
este caso, el punto pico del gradiente fue desplazada por el estímulo de reforzamiento en una dirección
alejada del estímulo de extinción (un cambio de pico). (Ocurren efectos similares cuando la discriminación
está basada en una frecuencia más alta de reforzamiento durante un estímulo que en otro; Guttman,
1959).

Figura 7-4. Gradientes del control de estímulo. El gradiente de generalización muestra el picoteo a la
tecla posterior al reforzamiento ante el valor de 550 milimicrones (ED). El gradiente pos-discriminación
muestra el picoteo a la tecla posterior al reforzamiento ante el valor de 550 milimicrones (ED) y extinción
ante el valor de 570 milimicrones (E^). (el espectro va de violeta y azul en las ondas cortas a rojo en las
ondas largas; los estímulos discriminativo y delta se localizaron en la región amarillo-verde). El pico del
gradiente de generalización se localiza ante el valor del ED. El gradiente pos-discriminación muestra
desviación del pico, la máxima cantidad de respuestas cambia del valor del ED en una dirección lejana al
valor E^. (de Hanson, 1959; Figura 1).
Una explicación de la forma del gradiente de postdiscriminación (Spence, 1937) asumió que el
reforzamiento durante un estímulo incrementaba la respuesta centrada en ese estímulo (gradiente
excitatorio), que la extinción durante otro estímulo producía un gradiente de respuesta decreciente
centrado en ese segundo estímulo (gradiente inhibitorio), y que después del entrenamiento en
discrimiación la respuesta producida por otros estímulos podía predecirse al restar el gradiente inhibitorio
del gradiente excitatorio. El gradiente teórico de Spencer mostraba un cambio de pico: su punto máximo
era desplazado del estímulo con reforzamiento hacia una dirección lejana al estímulo de extinción. Sin
embargo, el gradiente nuevo, producido por la resta, era más bajo que el gradiente excitatorio original; de
tal manera, era consistente con la forma pero no con el valor absoluto de los gradientes de
postdiscriminación (Hearst, Besley, & Fathing, 1970).
Los efectos del entrenamiento en discriminación sobre la forma de los gradientes despertó preguntas
acerca de los orígenes del pico del gradiente de generalización. Una sugerencia era que la inclinación de
un gradiente dependía de la discriminabilidad de los estímulos en varios puntos a lo largo de la
dimensión. En el gradiente de generalización de la Figura 7-4, por ejemplo, la tasa de respuesta decreció
con mayor inclinación con longitud de onda por debajo del estímulo de reforzamiento que por encima (la
tasa más baja a 520 que a 580 milimicrones). Pero cuando la amplitud e inclinación de los gradientes de
generalización alrededor de los estímulos en regiones diferentes del espectro fueron comparadas con los

umbrales para cambios en longitud de onda en estas diferentes regiones, no se encontraron relaciones
simples entre generalización y discriminabilidad (Guttman & Kalish, 1956).
Otra sugerencia fue que los gradientes en pico dependían de aprendizaje en discriminación que ocurrió
antes de que el organismo fuese llevado a la situación experimental. Por ejemplo, un pichón
supuestamente aprende discriminaciones entre los colores de los granos que come antes de que observe
amarillos en una prueba de generalización; sus discriminaciones de color podrían entonces ser más
aguzadas en la región amarilla del espectro simplemente porque el amarillo predomina entre los colores
de estos granos. No podemos estar seguros cuáles discriminaciones de color son adquiridas en
ambientes naturales, pero podemos crear un ambiente en el cual las discriminaciones de color no son
posibles al criar un organismo en luz monocromática, un ambiente iluminado solamente por una banda
muy estrecha de longitudes de onda tal como la luz amarilla emitida por una lámpara de vapor de sodio.
Para los humanos en tales ambientes, los objetos no poseen color; todo aparece en tonos de gris. Un
organismo criado en tal ambiente no tiene oportunidad de aprender discriminaciones de color.
Un organismo apropiado para crianza monocromática es la cría de pato, capaz de caminar, picotear,
comer, y beber tan pronto sale del cascarón; así, los procedimientos de reforzamiento pueden iniciarse
temprano. Los gradientes de generalización a lo largo de longitudes de onda de crías de pato criados
monocromáticamente han sido algunas veces planos (tal como en la Figura 7-3, arriba; Peterson, 1962),
y algunas veces en pico (tal como en la Figura 7-3, abajo; Rudolph, Honig, & Gerry, 1969; Tracy, 1970),
sugiriendo que las crías de pato algunas veces atienden a color aún sin experiencia en color. Sin
embargo, cuando las crías de pato criadas monocromáticamente fueron entrenadas a discriminar sólo
entre dos longitudes de onda, sus gradientes postdiscriminatorios fueron similares a aquellas crías de
patos criadas normalmente, incluyendo cambios de pico, aún cuando los estímulos consistieron en su
mayoría de longitudes de onda que nunca habían visto antes (Terrace, 1975). La implicación es que el
mayor efecto de contingencias se encuentra en la atención al color y no en consistencias de respuesta a
lo largo de la dimensión de longitud de onda (como cuando una cría de pato responde más al naranja que
al amarillo después de reforzamiento durante rojo).
Gradientes Inhibitorios.
Una vez que la explicación de Spencer fue proporcionada para manejar la forma de los gradientes
postdiscriminatorios, surgió el interés en encontrar una manera de registrar los gradientes inhibitorios en
forma directa. Las dificultades fueron tanto metodológicas como teóricas. Para determinar si un estímulo
reducía la respuesta, para empezar, debía existir algún tipo de respuesta durante el estímulo. Se
necesitaba un procedimiento que pudiese separar la dimensión a lo largo de la cual se determinaba el
gradiente de extinción, aparte del que estaba correlacionado con reforzamiento (Jenkins, 1965; Hearst,
Besley, & Farthing, 1970). Tal procedimiento se ilustra en la Figura 7-5 (Honig, Boneau, Burstein, &
Pennypacker, 1963). Con un grupo de pichones, el estímulo de reforzamiento consistía en una línea
vertical sobre la tecla y el estímulo de extinción consistía en una tecla iluminada sin línea; con un
segundo grupo, estos estímulos fueron invertidos. Para ambos grupos, se emplearon programas de
intervalo variable (IV) durante el entrenamiento, y los gradientes de control del estímulo a lo largo de la
dimensión de orientación de la línea se obtuvieron durante no reforzamiento.
La Figura 7-5 muestra datos para dichos grupos de cada uno de los estudios. Cuando la vertical estaba
correlacionada con reforzamiento y su ausencia con extinción, la tasa de picoteo decreció con
desviaciones grandes de la vertical (triángulos); este es un gradiente de reforzamiento similar al de la
Figura 7-3 (abajo). Sin embargo, cuando la ausencia de la línea estaba correlacionada con reforzamiento
y la línea vertical estaba correlacionada con extinción, la tasa de picoteo incrementó con desviaciones
mayores de la vertical (círculos). El cambio de orientación de la línea afectó su distancia del estímulo de
extinción vertical mas no su distancia del estímulo de reforzamiento, la ausencia de línea.
Figura 7-5. Gradientes del control del estímulo excitatorios e inhibitorios posterior a un programa de
reforzamiento intervalo-variable durante el ED y extinción (E^). En dos estudios con pichones (símbolos
con relleno y sin relleno) se correlacionó una línea vertical con reforzamiento y su ausencia con extinción
para un grupo. El valor del estímulo se invirtió para el segundo grupo. Las respuestas durante las
orientaciones de varias líneas y su ausencia fueron determinadas durante la ausencia de reforzamiento.
(de Honig, Boneau, Burstein & Pennypacker, 1963; Figura 1).
Siempre podemos preguntarnos acerca de las dimensiones de estímulo a las cuales un organismo

atiende. Por ejemplo, supongamos que el pichón solamente ve la orilla superior de la tecla. A medida que
la línea se desvía de la vertical, su parte superior se retira de la orilla superior de la tecla de tal manera
que la orilla superior de la tecla tiene más parecido con la de una tecla sin línea. Tales posibilidades
deben ser evaluadas experimentalmente (por ejemplo, removiendo porciones de la línea para observar si
esto cambia el comportamiento del pichón; cf. Touchette, 1969). Otro factor es que es más probable que
los organismos atiendan a propiedades de estímulos correlacionadas con reforzamiento (discriminación
de forma positiva) que a aquellas correlacionadas con extinción (Jenkins & Sainsbury, 1970; cf. Capítulo
8 sobre observación de respuestas).
DESVANECIMIENTO: CONTROL DEL ESTÍMULO POR APROXIMACIONES SUCESIVAS.
Así como las propiedades de la respuesta que definen una clase operante pueden ser cambiadas
gradualmente mediante procedimientos de moldeamiento, las propiedades del estímulo que definen una
clase operante discriminada pueden ser cambiadas gradualmente mediante procedimientos análogos
llamados desvanecimiento aditivo o sustractivo. El entrenamiento no necesita iniciar con estímulos
difíciles de discriminar. Por lo contrario, puede iniciar con estímulos de fácil discriminación y después
cambiar gradualmente a otros más difíciles. Por ejemplo, es generalmente más difícil enseñar a un pichón
a discriminar entre líneas verticales y horizontales que entre rojo y verde. Sin embargo, una vez que
existe una discriminación entre rojo y verde, una entre vertical y horizontal puede ser sucesivamente
aproximada sobreimponiendo vertical sobre rojo y horizontal sobre verde y entonces desvanecer
gradualmente los colores (Terrace, 1963b).
La creación de control del estímulo a través del desvanecimiento es con frecuencia efectivo (Sidman &
Rosenberger, 1967; Sidman & Stoddard, 1967), pero así como en el moldeamiento no existen reglas
simples para determinar qué tan rápido debería el estímulo ser desvanecido de manera aditiva o
sustractiva en situaciones particulares. Por ejemplo, si sobreimponemos vertical sobre rojo y horizontal
sobre verde y después desvanecemos parcialmente los colores, podríamos encontrar más tarde, después
de retirar los colores completamente, que el pichón había aprendido a discriminar entre vertical y
horizontal. Por otra parte, el desvanecimiento puede no ser exitoso; si el organismo atiende solamente a
los colores aún cuando éstos son muy leves, la discriminación puede no transferirse del color a la
orientación de la línea. En este caso, la respuesta discriminada probablemente desaparecerá cada vez
que desvanezcamos los colores por debajo de ciertos niveles de umbral.
Así como el moldeamiento requiere que cierto comportamiento esté disponible para ser moldeado, el
desvanecimiento requiere que cierta respuesta discriminada esté disponible para ser desplazada a una
nueva dimensión del estímulo. Por ejemplo, considere el aprendizaje de discriminación sin error (Terrace,
1963a). Tan pronto como los picoteos de los pichones sobre una tecla roja habían sido moldeados con
reforzamiento de alimento, el reforzamiento durante rojo se continuó de acuerdo a un programa de
intervalo variable. Períodos de tres minutos fueron alternados con otro estímulo, durante el cual los
picoteos no fueron reforzados. Al inicio, este otro estímulo era una tecla oscura que permanecía cinco
segundos. En un período de tres sesiones, su duración aumentó gradualmente y fue cambiada de oscura
a débilmente iluminada y entonces a más y más verde brillante, hasta que, para el ojo humano, su
brillantez correspondía a la de la tecla roja. Al término de estas condiciones, tres minutos de rojo
correlacionado con reforzamiento eran alternados con tres minutos de verde correlacionado con
extinción. Cada pichón en este grupo picoteó la tecla de extinción menos de 10 veces en el curso
completo del entrenamiento; el picoteo ocurrió casi sin excepción sobre la tecla roja más que sobre la
tecla verde. Para los pichones de otros grupos, para los cuales este procedimiento fue introducido
después de un entrenamiento inicial o para los cuales el verde fue introducido abruptamente con la
duración e intensidad completas, la tecla verde de extinción fue picoteada cientos y aún miles de veces
durante períodos equivalentes de entrenamiento.
El desvanecimiento aditivo gradual del verde fue en parte efectiva porque al oscurecer la tecla roja al
inicio del entrenamiento detuvo el picoteo del pichón por unos cuantos segundos (cualquier cambio
abrupto de estímulo pudo haber tenido ese efecto). No era probable que el picoteo empezara de nuevo
antes de que los 5 segundos del estímulo de extinción finalizaran. Así, desde el principio ocurrió una
diferencia en la respuesta, y los cambios graduales en duración e intensidad del estímulo de extinción
aumentó esta diferencia. Una vez que tal respuesta discriminada ha ocurrido, el estímulo de extinción
desvanecido podría ser cambiado a estímulo de reforzamiento y el pichón podría nunca responder
durante ese estímulo y nunca descubrirlo. El sentido en el cual tal desempeño es sin error no es obvio.
Debemos ser cautelosos acerca del lenguaje de los errores; el término error implica un juicio acerca del
valor de la respuesta que puede ser inapropiado para un análisis del comportamiento. Sin embargo, el
procedimiento de desvanecimiento no es sólo de interés teórico; puede tener mucha importancia práctica
por sus aplicaciones potenciales para la educación.
LOS VOCABULARIOS DE LA DIFERENCIACIÓN Y LA DISCRIMINACIÓN.
Tanto la diferenciación como la discriminación involucran reforzamiento diferencial. La principal diferencia

es si el reforzamiento diferencial es impuesto sobre propiedades de la respuesta o sobre propiedades de
los estímulos durante los cuales la respuesta ocurre. La implicación mayor de la diferencia es de
procedimiento: en los estudios de diferenciación el experimentador debe esperar las respuestas del
organismo, mientras que en estudios de discriminación el experimentador controla el orden y duración de
las presentaciones del estímulo. El vocabulario de la diferenciación y la discriminación se resumen en la
tabla siguiente:

REFORZAMIENTO CONCENTRACIÓN EXTENSIÓN DE LOS REFORZAMIENTO

DIFERENCIAL DE EFECTOS DEL EFECTOS DEL DIFERENCIAL POR
(OPERACIÓN) REFORZAMIENTO REFORZAMIENTO APROXIMACIONES
(PROCESO) (PROCESO) SUCESIVAS
(OPERACIÓN)
Con respecto a propiedades de la

respuesta Diferenciación Inducción Moldeamiento
Con respecto a propiedades del

estímulo Discriminación Generalización Desvanecimiento
El reforzamiento diferencial puede basarse en dimensiones simples de estímulos, tales como intensidad o
ubicación. La cuestión experimental es si la respuesta se conforma a las consecuencias diferenciales, en
tanto que más respuestas ocurren en presencia de los estímulos correlacionados con reforzamiento que
en presencia de aquellos correlacionados con no reforzamiento.
El reforzamiento diferencial también puede ser arreglado para propiedades complejas de estímulos que
no son fácilmente cuantificadas. Por ejemplo, los niños que aprenden a leer deben poder nombrar las
letras del alfabeto. Pero las propiedades importantes para distinguir entre algunas letras son diferentes de
aquellas importantes para distinguir entre otras (por ejemplo, línea recta vs. curva es importante para
distinguir U y V pero no V y N), y distinciones diferentes son importantes para letras minúsculas que para
letras mayúsculas (por ejemplo, ningún par de letras mayúsculas tiene versiones arriba-abajo o derecha-
izquierda que deben dominarse para leer b, p, d, y q). La manera en la cual un niño aprende a distinguir
letras del alfabeto depende de las relaciones entre tales propiedades del estímulo como simetría,
curvatura y cierre. Estas propiedades esenciales para discriminar entre letras diferentes se llaman
características críticas (Gibson, 1965).
Sin embargo, no es suficiente enumerar las características críticas. Para ciertas letras, las formas
mayúscula y minúscula difieren más entre sí que lo que difieren de otras letras (por ejemplo, e, E, y F, o
h, n, y N). Dada la multitud de formas, ¿Qué define entonces la clase de estímulos que nos ocasiona
decir A o B o C? Esta cuestión es acerca de la estructura del estímulo de las letras del alfabeto. El
problema se complica más cuando se consideran diferentes contextos. Por ejemplo, O podría ser una
letra o un cero, e I podría ser una letra o un número romano. El concepto de una X o una Y o una Z es
definido por la clase de estímulos a los cuales respondemos con el nombre de la letra correspondiente,
pero veremos que tales clases están basadas en comportamiento más que en propiedades físicas
comunes.

Sección B Cognición Animal.
Las operantes discriminadas son clases de comportamiento definidas por los estímulos que ocasionan la
respuesta. Tales clases son con frecuencia identificadas en nuestro vocabulario cotidiano, como cuando
hablamos de detenernos en un semáforo en rojo o contestando un teléfono. La luz roja puede variar en
brillantez y tamaño y el timbre del teléfono puede variar en volumen y timbre, pero la respuesta es
razonablemente independiente de variaciones en tales dimensiones, así que hablamos en términos de
estas clases de eventos más que en términos de ejemplos particulares.
En este texto frecuentemente tratamos los estímulos como si estuviesen restringidos a objetos concretos
o eventos ambientales. Pero a pesar de que podemos aprender a responder en formas consistentes a
objetos o eventos en nuestro ambiente, podemos también discriminar características, algunas veces
llamadas abstractas o relacionales, que son independientes de cualquier objeto o evento particulares. Por
lo tanto el término estímulo puede funcionar de una manera más general, en el sentido de alguna
propiedad de eventos ambientales. Por ejemplo, podríamos decir que una silla ha sido colocada a la
derecha de una mesa. A pesar de que la silla y la mesa son objetos concretos, estar-a-la-derecha-de no
lo es, y aún así podemos claramente discriminar esta relación de la de estar-a la-izquierda-de. Por lo
tanto, en algunos experimentos de discriminación, las relaciones entre estímulos han sido las
dimensiones de interés.
El campo de la cognición animal ha estado especialmente interesada con la identificación de las

propiedades de eventos ambientales que pueden ser discriminadas por diferentes especies. Sus
desempeños son de particular interés cuando dependen de la discriminación de propiedades relacionales
complejas del ambiente. Los estudios en cognición animal han examinado una variedad de desempeños
discriminativos, incluyendo juicios de simetría visual (Delius & Nowak, 1982); discriminaciones de
numerosidad (Davis & Pérusse, 1988); búsqueda visual (Blough, 1989); control discriminativo por
contingencias de reforzamiento o estímulos correlacionados con esas contingencias (Killeen, 1981;
Washburn, Hopkins, & Rumbaugh, 1991); la organización del comportamiento dentro de una secuencia
discriminada secuencialmente (Terrace & Chen, 1991); discriminaciones temporales (Cheng & Roberts,
1989); y respuesta bajo el control del comportamiento del propio organismo (Shimp, Sabulsky, & Childers,
1989), para mencionar sólo unos cuantos. Se presentan muchos ejemplos de investigación sobre
cognición animal en diversas partes de este texto, así que esta sección muestra solamente una muestra
altamente selectiva.
Considere un pichón que observa la manecilla de un reloj que es proyectada en la tecla central de tres
teclas (Neiworth & Rilling, 1987). La manecilla inicia en la vertical y rota a una tasa constante desde la
vertical hasta 90º; después desaparece. Un poco después reaparece más abajo, a 135º o 180º. El tiempo
de su reaparición es o consistente o inconsistente con una tasa constante de rotación mientras está
invisible. Después de una prueba consistente con una rotación constante, los picoteos de la tecla
izquierda son reforzados; después de una inconsistente, los picoteos de la tecla derecha son reforzados.
Los pichones aprendieron a discriminar los ensayos que mantenían una tasa de rotación constante de
aquellos donde la tasa de rotación era irregular aún cuando la rotación del estímulo no estaba presente
parte del tiempo; la discriminación también se transfirió a la reaparición de la manecilla en nuevas
ubicaciones. Este desempeño no estuvo basado en duraciones de ensayos o ubicaciones específicas de
la manecilla, y por lo tanto demuestra seguimiento visual aún en ausencia del estímulo visual; dicho
seguimiento es a veces llamado imaginería (ver el Capítulo 15). Coloquialmente, podríamos decir que el
pichón supo dónde estaba el estímulo aún cuando no era visible (una habilidad muy útil, como cuando un
insecto comestible pasa detrás de un obstáculo y un pájaro espera su salida desde el otro lado).
Los estudios acerca de la cognición animal se interesan con lo que un organismo sabe, y las
explicaciones son con frecuencia enmarcadas en términos de la estructura de los estímulos relevantes
(por ejemplo Capítulo 1 sobre lenguajes estructurales y funcionales). Por ejemplo, si un organismo
discrimina entre estímulos en base a alguna característica crítica, un cognitivo animal podría decir que el
organismo se representa a sí mismo los estímulos en términos de esa característica (en el ejemplo de la
manecilla del reloj, que el pichón representa o imagina su movimiento constante). El papel de las
representaciones en las teorías biológicas fue discutido en el contexto de la selección natural en el
Capítulo 2; el tema es retomado en el contexto de las teorías cognitivas y conductuales en el Capítulo 15,
donde argumentamos que la imaginería es más correctamente tratada como un tipo de comportamiento.
MAPAS COGNITIVOS.
Siempre que los ambientes locales tienen propiedades diferentes es ventajoso para un organismo poder
moverse de uno a otro. Un ambiente con un abastecimiento rico y estable de alimento es preferible que
otro con un abastecimiento empobrecido y variable; un ambiente en el que el alimento es de fácil acceso
es preferible a otro en el que el mismo alimento existe pero es menos accesible; un ambiente con áreas
seguras para la procreación y crianza de la camada es preferible a uno que es más peligroso; etc. (La
explicación cubre por lo menos a muchos grupos animales. Nos llevaría muy fuera del tema el considerar
las contingencias filogenéticas que operaron en la evolución de las plantas, pero es apropiado hacer
notar que muchas plantas dispersan sus semillas; los animales se encuentran con frecuencia
involucrados en esa dispersión, como cuando las abejas polinizan las flores).
Una vez que un tipo de orientación ha emergido, es probable que la selección natural la agudice a lo
largo del tiempo filogenético (Capítulo 2). Por lo tanto, no es sorprendente que muchas especies animales
se muevan con facilidad en el mundo. Parte de su navegación es aprendida y parte no. Gallistel (1990)
ofrece un tratamiento detallado que abarca desde forrajeo en hormigas hasta la ecolocación en
murciélagos y selección de rutas en chimpancés, y cubriendo desde orientaciones basadas en
dimensiones de estímulo simples tales como gradientes de olor o luz hasta variedades que son
funcionalmente equivalentes a la navegación celeste. Los organismos que dejan sus áreas de anidación
deben poder regresar a ellos; mientras puedan hacerlo con mayor precisión, más extensamente podrán
forrajear. Los organismos que almacenan alimento durante el invierno deben poder localizarlo
posteriormente; mientras más variables sean sus sitios y mientras puedan localizar mayor cantidad de
sitios, será menos probable que sus competidores se queden con lo que han almacenado (Balda, Kamil,
& Grim, 1986). Los organismos que escapan a un depredador deben poder localizar rutas de escape;
aquellos que permiten ser perseguidos hacia rutas sin salida no sobrevivirán.
Consideramos algunos temas relevantes a la orientación espacial al discutir aprendizaje de lugar vs.
Aprendizaje de respuesta. Los dos tipos de comportamiento se distinguían principalmente si los estímulos
fuera del laberinto eran accesibles para la rata. Si sí lo eran, la rata se orientaba dentro de un estímulo
complejo mayor, el cuarto dentro del cual el laberinto estaba situado; aprendía lugares. Si no, solamente
dominaba giros específicos dentro del laberinto; aprendía respuestas. Se añadieron complejidades en
otros experimentos de laberinto (Olton, 1979). Por ejemplo, se demostró que la rata algunas veces elige
la ruta más corta accesible a través de un laberinto cuando otra ruta preferida anteriormente se encuentra
bloqueada, o que algunas veces toma atajos apropiados que acaban de ser añadidos al laberinto aún
cuando no los ha recorrido anteriormente. Estos resultados ofrecen la justificación para hablar de mapas
cognitivos (Tolman, 1948); el hallazgo de que los organismos pueden localizar un área aún cuando se
aproximan a ella desde una nueva dirección demuestra que aprenden relaciones espaciales en adición a
o quizá aún en lugar de trayectorias específicas.
Los problemas para determinar las características ambientales a las cuales los organismos atienden
mientras se trasladan de un lugar a otro emergen a mayor escala en orientación y migración. Las avispas
regresan a sus nidos, las abejas a sus panales, los salmones a sus ríos de origen, y los pájaros a sus
terrenos de anidación de temporada. Entre las características ambientales que pueden ser importantes
son señales, luz polarizada, gradientes químicos, campos magnéticos, y la ubicación y movimiento del sol
y las estrellas (Tinbergen, 1972; Walcott, Gould, & Kirshvink, 1979; Von Frisch, 1953). En algunos casos
en los que los organismos navegan a regiones que nunca antes han visitado, lo hacen aisladamente; en
otros, lo hacen en compañía de otros miembros de su especie. Ambos casos pueden involucrar una
importante cantidad de componentes filogenéticos, ya sea con respecto a propiedades importantes de los
ambientes o con respecto a las contingencias que llevaron a la migración del grupo (o ambas). Con
respecto a las migraciones a grandes distancias, las contingencias filogenéticas pueden haber
involucrado la selección de aquellos capaces de sostener la orientación sobre viajes gradualmente más
largos a medida que los continentes se separaron lentamente en el tiempo geológico (Skinner, 1975).
Una explicación más detallada de estos fenómenos está fuera del ámbito de este texto, pero ilustran que
un análisis de las propiedades del estímulo que determinan el comportamiento es relevante a la filogenia
así como a la ontogenia.
CONCEPTOS NATURALES Y CLASES PROBABILÍSTICAS DE ESTÍMULO.
Los conceptos han sido llamados como generalización dentro de una clase de estímulos y discriminación
entre clases de estímulos (Seller & Schoenfeld, 1950). De tal manera, nuestro concepto de rojo debe
involucrar generalización entre todos los estímulos que denominamos rojos y discriminación entre estos
estímulos y otros que no denominamos rojos. Por lo tanto, los conceptos son a las clases de estímulos lo
que las operantes son a las clases de respuestas. (La respuesta basada en una única propiedad de
estímulos es algunas veces llamada abstracción, con el lenguaje de los conceptos restringido a la
respuesta sobre la base de alguna combinación de propiedades. No incluiremos esta distinción debido a
su ambigüedad potencial. Por ejemplo, estar-a-la-izquierda-de puede ser tratado como una única
propiedad relacional o como una combinación de propiedades que necesariamente incluyen un punto de
referencia y un estímulo a la izquierda de ese punto de referencia).
Ya anotamos que con frecuencia es difícil definir los estímulos discriminativos por sus dimensiones
físicas. Por ejemplo, las propiedades que definen la letra A varían dependiendo de si es mayúscula o
minúscula o si aparece impresa o manuscrita. La capacidad para discriminar entre tales estímulos existe
tanto en los animales como en los humanos (por ejemplo, se han demostrado discriminaciones entre
varias formas de la letra A y el dígito 2 en pichones; Morgan, Fitch, Holman, & Lea, 1976). Pero la
dificultad para definir estímulos en términos de propiedades físicas mensurables no se limita a las clases
arbitrarias creadas por humanos, yales como letras y números. También existen en objetos cotidianos y
eventos. ¿Qué distingue a los perros de otros animales? ¿Sobre qué base generalizamos entre un
chihuahua y un husky al llamarles perros, mientras discriminamos entre huskies y lobos o zorras?
Los pichones han sido enseñados a discriminar entre fotos que contienen una figura humana de aquellas
que no la contienen (Herrnstein & Loveland, 1975). Tales discriminaciones han sido llamadas conceptos
naturales. En un estudio (Herrnstein, Loveland, & Cable, 1976), se presentaron transparencias en
pantalla situada enseguida de una tecla de pichón y los picoteos fueron reforzados en presencia de
algunas transparencias mas no en otras. Algunos pichones aprendieron discriminaciones entre fotos con
y sin árboles; otros aprendieron discriminaciones entre fotos con y sin agua; aún otros aprendieron
discriminaciones entre fotos con y sin personas específicas. Después del entrenamiento con un juego de
transparencias (por ejemplo, transparencias con y sin árboles), los pichones discriminaron entre
transparencias que no habían sido presentadas previamente. Las transparencias nuevas eran en
ocasiones discriminadas con más precisión que las transparencias empleadas en el entrenamiento. Las
implicaciones fueron que
No podemos empezar a construir una lista de elementos comunes. Para reconocer un árbol, los
pichones no requirieron que fuera verde, frondoso, vertical, leñoso, con ramas, etc. (en el núcleo

del problema se encontraba el empleo de términos coloquiales tales como frondoso, vertical,
leñoso, etc.). Más aún, para ser reconocible como un no-árbol, una foto no necesitaba omitir
verdosidad, leñosidad, ramaje, verticalidad, etc. Tampoco podríamos identificar elementos
comunes en los otros dos experimentos. Si no son elementos comunes, entonces qué? Ninguna
otra teoría es tan fácilmente caracterizada, aunque una alternativa surge, aunque en términos no
refinados. Los pichones responden a grupos de características más o menos isomórficas con los
grupos a los que nosotros respondemos. El verde debería estar sobre las hojas, si el verde o las
hojas están presentes. Sin embargo, ninguna de las dos características es necesaria o suficiente.
Las partes verticales o con ramas deberían ser las partes leñosas, a pesar de que ninguna de
estas características tampoco es necesaria o suficiente. Lo que vemos como un árbol comprende
una lista compleja de conjunciones y disyunciones probabilísticas, cuyo descubrimiento requeriría
un esfuerzo mucho mayor que el que parece justificarse por cualquier beneficio posible
(Herrnstein, Loveland, & Cable, 1976, pp. 298-299).
Los conceptos naturales son ejemplos de clases probabilísticas de estímulo, clases en las cuales cada
miembro contiene algún subjuego de características pero ninguno es común a todos los miembros. La
cantidad de características en el subjuego puede variar de un miembro de la clase a otro. Tales clases,
algunas veces llamados juegos confusos, no poseen límites bien definidos, a pesar de que los miembros
de la clase posean semejanzas familiares (Rosch, 1973; Mervis & Rosch, 1981).
Algunas clases probabilísticas de estímulo se definen con referencia a un prototipo. Un prototipo es un

miembro típico de una clase probabilística; se deriva de un promedio ponderado de todas las
características de todos los miembros de la clase. Por ejemplo, los pájaros son una clase probabilística
de estímulo; la mayoría de ellos vuelan, pero los avestruces y los pingüinos no lo hacen. En la producción
de un pájaro prototípico, el plumaje debe ser más ponderado que los pies palmípedos porque más
pájaros poseen plumaje que patas palmípedas. De esta manera, un petirrojo es más prototípico que un
pato porque comparte más características con otros pájaros que el pato.
Otros tipos de clases de estímulo incluyen clases polimorfas de estímulo (Lea & Harrison, 1978; ver
Glosario) y clases equivalentes (más acerca de esto posteriormente). De hecho, la clase de clases de
estímulo es en sí misma una clase probabilística de estímulo, en el sentido de que su definición cambia a
medida que los límites de investigación relevante se expanden.
El problema de definir clases de estímulo es uno general. No se resuelve apelando a los procedimientos
de medición física, porque la lectura de metros u otros instrumentos también es comportamiento
discriminativo. Aún el comportamiento del científico depende de discriminaciones aprendidas en el
laboratorio. Como hemos visto, las distinciones entre reforzamiento, castigo, elicitación, y otros procesos
conductuales se basan en tales discriminaciones. El control del estímulo es tan fundamental con respecto
a nuestro comportamiento científico como lo es con respecto al comportamiento de los organismos que
estudiamos. Así, cualquier filosofía efectiva de la ciencia debe tomarlo en consideración.

Sección C. Discriminaciones Condicionales y Clases de Comportamiento de Orden Superior.
Al igual que las contingencias, las discriminaciones pueden ser efectivas en algunas circunstancias mas
no en otras. Por ejemplo, tu respuesta a un semáforo en rojo depende de si se encuentra frente a ti o
frente al tráfico que cruza la intersección. Tales discriminaciones, en las que el rol de un estímulo es
condicional a otros estímulos que están presentes, se denominan discriminaciones condicionales.
Considere el caso de la atención del pichón, que se ilustra en la Figura 7-2. Los estímulos disponibles son
triángulos o círculos sobre fondos rojo o verde. Si añadimos una lámpara sobre la tecla, podemos reforzar
picoteos en presencia de triángulos cuando la lámpara está encendida y picoteos en presencia de rojo
cuando no está encendida. Bajo estas circunstancias, el pichón llegará a picotear triángulos pero no
círculos, sobre rojo o sobre verde, cuando la lámpara está encendida; y las teclas con fondos rojos pero
no verdes, con triángulos o círculos, cuando está apagada (cf. Reynolds, 1961ª). En otras palabras, la
discriminación del pichón de forma o color es condicional del estado de la lámpara.
Consideremos ahora algunos procedimientos experimentales en los que las contingencias de

discriminación dependen del contexto dentro del cual están arregladas. Incluyen juego de aprendizaje,
igualación a la muestra, y los procedimientos de igualación arbitrarios que producen clases equivalentes.
Estos procedimientos generan clases de comportamiento de orden superior, en el sentido de que las
clases no se definen por estímulos o respuestas particulares, sino por relaciones que incluyen aquellos
estímulos y respuestas como casos especiales (cf. Capítulo 6).
ARREGLO DE APRENDIZAJE.
El aprendizaje de una nueva discriminación puede modificarse por la historia de aprendizaje

discriminativo del organismo. Tal como se ilustra en el fenómeno llamado arreglo de aprendizaje (Harlow,
1949), las relaciones entre las propiedades de un estímulo pueden controlar la respuesta
independientemente de los estímulos específicos. Se presentaron dos objetos diferentes a un mono en
privación de alimento en ensayos sucesivos. Sus posiciones variaron de ensayo en ensayo. El alimento
estaba bajo uno de esos objetos, y por lo tanto, la respuesta de tomarlo era reforzada diferencialmente.
Después de un número de ensayos, el mono dominó la discriminación. Entonces, en un nuevo problema,
se presentó otro par de objetos, con reforzamiento diferencial arreglado para tomar sólo uno de ellos. De
nuevo, emergió una discriminación. Se presentó un nuevo problema con otro nuevo par, y después otro,
etc.
En la Figura 7-6 se muestran los datos promediados de ocho monos. Cada juego de puntos muestra el
porcentaje de respuestas correctas a través de los primeros seis ensayos en bloques de problemas
sucesivos. En los primeros ocho problemas (1-8), las respuestas correctas incrementaron gradualmente
a lo largo de los ensayos; en el sexto ensayo, todavía no lograban el 80%. En el siguiente bloque de ocho

problemas (9-16), las respuestas correctas incrementaron con mayor rapidez a lo largo de los ensayos.
En bloques sucesivos, las respuestas correctas incrementaron con mayor rapidez a lo largo de los
ensayos hasta que, en el último bloque de ensayos (289-344), las respuestas correctas alcanzaron casi el
100% en el segundo ensayo de cada nuevo problema. En otras palabras, mientras más problemas
dominaba el mono, más rápidamente dominaba cada nuevo problema.
En este procedimiento, la operante discriminada no puede ser descrita simplemente en términos de un

par de estímulos. Cuando las discriminaciones sucesivas son adquiridas con tanta rapidez que los monos
consistentemente eligen el estímulo correlacionado con reforzamiento después de un solo ensayo con un
nuevo par, el desempeño depende de relaciones entre estímulos y sus consecuencias correlacionadas en
problemas sucesivos y no de los pares de estímulos particulares que aparecen en cada problema. Dentro
de cada uno de los primeros problemas, el mono tenía que aprender no solamente cuál estímulo estaba
correlacionado con alimento, sino también muchos otros aspectos del procedimiento (ejm., que el
alimento está correlacionado con sólo uno de los dos estímulos más que con la posición u otras
características del arreglo; que esta correlación no cambia dentro de un problema; que tomar
simultáneamente los dos estímulos no es reforzado; etc.) Durante los primeros problemas, el aprendizaje
tuvo lugar lentamente porque el mono estaba aprendiendo todas estas cosas; eventualmente, cuando el
mono había aprendido estas otras cosas, todo lo que tenía que aprender en cualquier nuevo problema
era cuál estímulo estaba correlacionado con alimento.
Figura 7-6. El arreglo de aprendizaje o aprender a aprender. Ocho monos aprendieron una variedad de
problemas de discriminación con dos elecciones. Cada punto representa el porcentaje de respuestas
correctas alrededor de los primeros seis ensayos de cada problema por blocks de problemas sucesivos
(el eje de las “y” representa el inicio al 50% de aciertos, nivel al azar). La tasa de aprendizaje incrementa
conforme se presentan los ensayos problema. Para el ultimo block de problemas, las respuestas se
presentaron alrededor del 100% de precisión por el segundo ensayo con cada nuevo problema
(Adaptado de Harlow, 1949, Figura 2).

En este punto, podemos definir la operante discriminada de la siguiente manera: Si la respuesta a un

estímulo es reforzada en el primer ensayo de un nuevo problema, la respuesta a ese estímulo continúa
en los ensayos subsiguientes; si no es reforzada, la respuesta cambia al otro estímulo para todos los
ensayos subsiguientes. En un arreglo de aprendizaje, este es el desempeño al que se aproxima el
desempeño del organismo. De esta manera, la correspondencia entre las contingencias de reforzamiento
y el comportamiento generado por estas contingencias permanece como criterio apropiado para esta
clase de comportamiento. El arreglo de aprendizaje califica como una clase de orden superior porque
está definido por estas relaciones y no por los estímulos y respuestas de un problema particular.
Un fenómeno que puede contemplarse como variación de un arreglo de aprendizaje es el desamparo

aprendido (Maier, Seligman, & Solomon, 1969). Por ejemplo, unas ratas que reciben una descarga
eléctrica inescapable e inevitable en una situación es menos probable que aprendan la respuesta de
evitación cuando tal respuesta resulta accesible en una nueva situación que las ratas no expuestas a
descarga eléctrica inescapable e inevitable (cf. Maier, Albin, & Testa, 1973). Aquí de nuevo es difícil
definir la clase de respuesta, salvo para hacer notar que las ratas en presencia de descarga eléctrica
inescapable e inevitable aparentemente aprendieron que sus respuestas no tuvieron consecuencias
importantes; el comportamiento generado por estas contingencias se transfirieron a situaciones en las
cuales la respuesta pudo haber tenido consecuencias. Podemos asumir que, como una clase de orden
superior, el desamparo aprendido podría ser puesto bajo el control de estímulos discriminativos a través
de contingencias diferenciales.
El arreglo de aprendizaje no solamente ilustra la amplitud y complejidad de las clases de estímulo y

respuesta que los organismos pueden aprender; también muestra que lo que sucede cuando un
organismo experimentalmente ingenuo es introducido a un contexto experimental no puede ser
considerado como un simple ejemplo de aprendizaje (cf. Capítulo 4 sobre la adquisición del
comportamiento). Por lo tanto, para estudiar el aprendizaje, algunos investigadores se han dirigido hacia
la adquisición repetida de discriminaciones simples o secuencias simples de respuesta. Paradójicamente,
han llegado a estudiar aprendizaje, definido como cambios en el desempeño, en el contexto de
procedimientos de estados constantes, definidos por la estabilidad en el desempeño. Por ejemplo, Boren
y Devine (1968) arreglaron cuatro grupos de tres palancas dentro de la cámara de un mono. Dentro de
cualquier sesión, era reforzada sólo una secuencia particular de respuestas a la palanca (por ejemplo,
palanca izquierda del grupo 1, palanca derecha del grupo 2, palanca central del grupo 3, palanca derecha
del grupo 4), pero la secuencia cambiaba de sesión a sesión. Una vez que la tasa de dominio del mono
de un nuevo problema se estabilizó, estas adquisiciones repetidas aportaron una línea base para el
estudio de una variedad de fenómenos: efectos de diferentes procedimientos de desvanecimiento;
efectos de drogas sobre aprendizaje; efectos de diferentes tipos de consecuencias para respuestas en
posiciones diferentes en la secuencia; efectos de la creación de la secuencia como un todo en lugar de

construirla desde el inicio o desde el final; etc.
IGUALACIÓN A LA MUESTRA.
Muchas discriminaciones condicionales involucran relaciones arbitrarias entre el estímulo discriminativo

condicional y las discriminaciones para las cuales presenta la ocasión. Algunos casos en los que las
relaciones no son arbitrarias son de especial interés. Por ejemplo, si un estímulo en un arreglo de
estímulos iguala uno de los demás o no iguala a ninguno depende de, o es condicional del contexto de
otros estímulos dentro de los cuales se presenta. Ahora consideraremos algunas propiedades de dichas
discriminaciones condicionales.
La igualación a la muestra se ilustra en la Figura 7-7 como pudiese arreglarse en una cámara de pichón
con tres teclas (cf. Skinner, 1950; Ferster, 1960). Durante un intervalo entre ensayos, todas las teclas
están oscuras. El ensayo inicia con la iluminación de la tecla central, la muestra. Típicamente se requiere
un picoteo en la tecla central; este picoteo garantiza que el pichón observa el estímulo muestra (el picoteo
es algunas veces llamado respuesta de observación, pero el término también aplica en otros casos en los
que una respuesta produce algún estímulo discriminativo; cf. Capítulo 8). Esta respuesta enciende un
estímulo de comparación en las dos teclas laterales. Una de ellas iguala al estímulo muestra y la otra no.
Un picoteo en la tecla de igualación produce entonces un reforzador seguido de un nuevo intervalo entre
ensayos, mientras que un picoteo en la tecla de no igualación es seguido inmediatamente por el intervalo
entre ensayos sin reforzador (algunas veces el picoteo de no igualación extiende también la duración del
intervalo entre ensayos, en el supuesto de que tal consecuencia castiga los picoteos de no igualación).
El estímulo de muestra normalmente cambia de ensayo a ensayo (por ejemplo, verde en algunos
ensayos y rojo en otros); la posición de la tecla de igualación también cambia de ensayo a ensayo. Una
característica común de la igualación a la muestra es un procedimiento de corrección, el cual arregla una
repetición de los mismos estímulos de muestra y comparación en el siguiente ensayo si el ensayo termina
con un picoteo en una tecla de no igualación. Este procedimiento evita el desarrollo de respuestas
restringidas a una sola tecla o a un color. Por ejemplo, suponga que un pichón picotea solamente el
estímulo de comparación en la tecla izquierda. Si la tecla de igualación fuese alternada irregularmente
entre izquierda y derecha, estos picoteos serían reforzados la mitad de los ensayos (aquellos con el
estímulo de igualación en la derecha). El reforzamiento de la mitad de los ensayos sería probablemente
suficiente para mantener el picoteo en la tecla izquierda indefinidamente. Por otro lado, con un
procedimiento de corrección el pichón podría tener que cambiar hacia la tecla derecha tarde o temprano,
porque un ensayo con el estímulo de igualación en la derecha se repetiría hasta que ocurriese un picoteo
en la tecla derecha y fuese reforzado. De igual manera, si el pichón siempre picoteara las teclas laterales
rojas, estos picoteos serían reforzados en la mitad de los ensayos a menos que un procedimiento de
corrección forzara al pichón a cambiar ocasionalmente a las teclas laterales verdes.
Figura 7-7. Diagrama de un ensayo de igualación a la muestra con tres teclas. Después de un intervalo
entre ensayos de t segundos, un estímulo muestra (Tecla G) aparece en la tecla central. La respuesta a
la tecla del centro activa las teclas laterales. Uno de los estímulos de comparación iguala a la muestra; el
otro (Tecla R) no. La respuesta al estímulo de comparación correcto proporciona el reforzador y el
intervalo entre ensayos para que el siguiente ensayo comience; la respuesta al estímulo de comparación
incorrecto inicia el siguiente intervalo entre ensayos sin proporcionar el reforzador. Tanto el estímulo
muestra como la localización derecha-izquierda de los estímulos de comparación varían de ensayo a
ensayo.
Suponga ahora que un pichón está respondiendo con precisión en un procedimiento de igualación a la
muestra con estímulos rojo (R) y verde (V). ¿Cómo deberíamos describir este desempeño? ¿Ha
aprendido el pichón solamente a picotear la tecla izquierda en presencia de las configuraciones RRV y
VVR y la tecla derecha en presencia de las configuraciones VRR y RVV? ¿O ha aprendido la igualación
en general, la relación de identidad? Podríamos presentar azul o amarillo como los nuevos estímulos de
muestra. Si el pichón igualase estos nuevos colores podríamos hablar con más confianza acerca de
igualación generalizada (de hecho, la igualación en los pichones no se transfiere fácilmente a colores
nuevos, a pesar de que la probabilidad de tal transferencia depende de los detalles del entrenamiento).
Pero aún si observamos igualación con nuevos colores, ¿Qué sucedería si fallamos en lograr igualación
con estímulos geométricos como muestra y comparación? Podríamos simplemente decir que el pichón ha
aprendido igualación de color mas no de forma, haciendo notar que el concepto humano de igualación no
parece estar tan limitado por las dimensiones específicas de los estímulos de igualación. (La igualación a
la muestra ha sido en ocasiones llamada igualación de identidad, pero ese término se reserva para casos
en que la igualación se generaliza a estímulos de muestra y comparación novedosos, tales como la
igualación de formas después de entrenamiento con colores; con un arreglo limitado de estímulos, lo que

parece igualación sobre la base de identidad puede en su lugar ser igualación basada en configuraciones
específicas del estímulo).
Una alternativa es modificar el procedimiento de igualación a la muestra, con la esperanza de realzar el

control de los estímulos de muestra y comparación. Por ejemplo, el procedimiento puede modificarse de
tal manera que la producción de los estímulos de comparación dependa de diferentes patrones de
respuesta para cada estímulo de muestra (por ejemplo, tasas diferentes de respuesta). Tales
procedimientos algunas veces producen una adquisición más rápida de la igualación, pero
desafortunadamente el control del estímulo realzado por los estímulos de muestra en ocasiones produce
aquélla producida por el estímulo de comparación (Urcuioli & ONG, 1980).
Existen muchas variaciones de igualación a la muestra. Si se arregla el reforzamiento para picoteos en la

tecla de no igualación en lugar de la de igualación, el procedimiento se convierte en un ejemplo de
respuesta de singularidad, porque esta tecla es necesariamente la singular de las tres teclas (en otras
versiones de procedimientos de singularidad, no se emplea muestra; con pichones en una cámara con
tres teclas, por ejemplo, cada ensayo consiste en encender las tres teclas, cualquiera de ellas siendo la
tecla singular).
Las relaciones entre estímulos pueden involucrar también igualación arbitraria. Por ejemplo, podríamos
entrenar a un pichón a picotear una tecla verde dado un cuadrado como muestra y una tecla roja dado un
círculo como muestra. Podríamos después preguntar si el pichón picotearía un cuadrado dada una
muestra verde y un círculo dada una muestra roja. Con frecuencia esperamos tal reversibilidad cuando
trabajamos con palabras y objetos, como cuando un niño que ha aprendido a apuntar hacia el dibujo de
un coche al ver la palabra coche también puede apuntar hacia la palabra al ver el dibujo. Esta
reversibilidad, propiedad del comportamiento simbólico, no debe darse por hecho; por ejemplo, un niño
puede mostrar tal reversibilidad sin entrenamiento específico mas no un pichón. La igualación arbitraria
puede también extenderse a casos en los que la misma respuesta de igualación es entrenada con más
de una comparación (por ejemplo, picotear una tecla verde de comparación dados o un círculo o una
elipse como muestra, y picotear una roja dados o un cuadrado o un triángulo; cf. Urcuioli, Zentall,
Jackson-Smith, & Steirn, 1989, en muchas tareas de igualación).
COMPORTAMIENTO SIMBÓLICO: CLASES EQUIVALENTES.
Si los picoteos de un pichón son reforzados en presencia de verde pero no de rojo, no podríamos hablar
del enverdecimiento del pichón en presencia de los picoteos. Tal cambio no tiene sentido conductual. Sin
embargo, este no es el caso en la igualación. Tanto el estímulo de muestra como la respuesta de
comparación se definen por los estímulos presentados en las teclas. Por lo tanto, podemos preguntar
acerca de una respuesta roja a un estímulo rojo, o acerca de la reversibilidad de una respuesta vertical a
un estímulo diagonal, a acerca de si pueden crearse respuestas circulares a estímulos débiles al entrenar
respuestas circulares a estímulos grandes y después respuestas grandes a estímulos débiles.
Estos casos ilustran relaciones llamadas reflexividad, simetría, y transitividad. Las relaciones reflexivas
son aquellas que se mantienen entre un término y sí mismo (por ejemplo, A=A); las relaciones simétricas
son aquellas en las que el orden de los términos es reversible (por ejemplo, si A=B entonces B=A); y las
relaciones transitivas son aquellas en las que los términos comunes en dos pares ordenados determinan
un tercer par ordenado (por ejemplo, si A=B y B=C entonces A=C). Las equivalencias entre clases de
estímulos se definen por estas relaciones (Sidman, Rauzin, Lazar, Cunninham, Tailby, & Carrigan, 1982;
Sidman & Tailby, 1982), las cuales son diferentes de aquéllas entre un estímulo discriminativo y las
respuestas que ocasiona. En otras palabras, las clases equivalentes involucran un tipo de control del
estímulo que no se encuentra en la contingencia de tres términos.
La Figura 7-8 ilustra como pueden emplearse los procedimientos de igualación estándar y arbitraria para
demostrar las relaciones de reflexividad, simetría, y transitividad. Cada procedimiento incluye dos
estímulos muestra, señalados como A en un arreglo de tres teclas en la izquierda, y como B en el de la
derecha. Por facilidad, el estímulo de igualación comparativo siempre se muestra a la izquierda del
arreglo de tres teclas, aún cuando en la práctica las posiciones laterales de los estímulos de comparación
varían de ensayo en ensayo. Así como en la Figura 7-8, un picoteo en la tecla de muestra produce los
estímulos de comparación, y un picoteo en la tecla de igualación comparativa produce alimento mientras
que uno en la tecla de comparación de no igualación no.
Las primeras dos filas de la Figura 7-8 (reflexividad) muestran procedimientos de igualación estándar con
color y con forma. Las siguientes dos filas (simetría) muestran primero igualación simbólica con muestras
de color y comparaciones de forma y después una prueba de cambio de dirección. Las filas del fondo
(transitividad) muestran cómo los estímulos comunes en dos procedimientos de igualación simbólica
(color-forma y forma-intensidad) pueden combinarse en una prueba de transitividad (color-intensidad).
Una prueba alternativa, mostrada en la última fila, combina pruebas de cambio de dirección y transitividad
(intensidad-color); en ocasiones es llamada una prueba de equivalencia, y la relación entre los estímulos
de la prueba de equivalencia es en ocasiones llamada una relación de equivalencia. Las relaciones de las
pruebas de cambio de dirección y equivalencia nunca fueron enseñadas explícitamente. Si en estas
pruebas ocurre una igualación apropiada, las nuevas relaciones demostradas por ese comportamiento
son llamadas relaciones emergentes, en el sentido de que han emergido sin entrenamiento explícito (cf.
Fields & Verhave, 1987).

Figura 7-8. Procedimiento de igualación para estudiar las tres propiedades de las relaciones de
equivalencia: reflexividad (relación de identidad), simetría (relación inversa arbitraria), y transitividad
(transferencia a través de pares ordenados de relaciones arbitrarias). Cada acomodo es mostrado
únicamente una vez de dos posibles. Con el estímulo de comparación a la izquierda. Los símbolos
incluyen color rojo (R) y verde (G), triángulos y círculos, y luz y oscuridad.
Ya hemos cuestionado si el desempeño de igualación estándar del pichón depende de la relación de

identidad en general o solamente de relaciones entre pares particulares de estímulos. Puede asumirse
que la relación de identidad entre estímulos de muestra y de comparación podrían hacer la igualación
estándar más fácil que la igualación arbitraria. Sin embargo, para los pichones, el tiempo que toma
producir la igualación depende más de las dimensiones del estímulo elegidas para muestras y
comparaciones que en si el procedimiento es estándar o arbitrario (Carter & Werner, 1978); por ejemplo,
tanto la igualación estándar y arbitraria con muestras roja vs. verde se desarrollan más rápidamente que
cualquiera de los dos procedimientos con muestras vertical vs. horizontal. Aún más, con pichones, la
igualación arbitraria producida con estímulos particulares de muestra y comparación no lleva a la
igualación cuando los estímulos de muestra y de comparación son cambiados en dirección (Holmes,
1979). Cualquiera que sea el estado de la transitividad, la falla en la demostración de reflexividad y
simetría lo torna inapropiado para hablar de equivalencias entre estímulos de muestra y de comparación
en el comportamiento de igualación del pichón.
Sin embargo, en humanos las relaciones de equivalencia se generan fácilmente. Por ejemplo, en jóvenes
con retardo que ya habían mostrado aprendizaje previo de reflexividad (igualación de identidad), dadas
cualquiera de 20 palabras habladas (A), para seleccionar los dibujos correspondientes (B) de un arreglo

de compasión (por ejemplo, coche, perro, muchacho; Sidman & Cresson, 1973; Sidman, Cresson, &
Wilson-Morris, 1974). Entonces, dadas las mismas 20 palabras habladas, aprendieron a seleccionar las
palabras impresas correspondientes (C) de un arreglo. Para todas las 20 palabras, igualadas de palabras
habladas a dibujos (AB) y de palabras habladas a palabras impresas (AC) también generó cuatro más
relaciones sin entrenamiento adicional; dos nuevas relaciones por cambio de dirección (BA, dado un
dibujo nombrándolo, y CA, dada una palabra impresa diciéndola), y dos por transitividad (BC, dado un
dibujo seleccionando la palabra impresa correspondiente, y CB, dada una palabra impresa seleccionando
el dibujo correspondiente). Se habían enseñado 40 relaciones (20 tanto para AB como para AC), y
emergieron indirectamente otras 80 (en BA, CA, BC, y CB). El reforzamiento de igualación arbitraria
había creado los inicios de un repertorio de lectura en estos jóvenes. Las relaciones emergentes pueden
justificadamente ser llamadas desempeños de igualación simbólica más que igualación arbitraria.
Cada una de las 20 clases equivalentes consistieron de un dibujo y las palabras correspondientes tanto
habladas como impresas. Se hubieran podido añadir más clases con nuevos dibujos y sus palabras
correspondientes, y el número de equivalencias se pudo haber expandido con la adición de nuevas
relaciones (por ejemplo, palabras impresas y manuscritas, dibujos y objetos). No existen límites obvios
para el número de clases que pueden crearse o para el número de estímulos que pueden ser incluidos
dentro de cada clase. Tales clases pueden ser una propiedad especial del comportamiento humano; si
pueden demostrarse con primates u otros organismos no humanos es un tema de controversia (ver
McIntire, Cleary, & Thompson, 1987, cuya demostración con monos macacos ha sido desafiada sobre la
base de que algunos aspectos del desempeño no eran emergentes sino que fueron enseñadas de
manera implícita durante los procedimientos de entrenamiento; Saunders, 1989).
Cualquier estímulo dentro de una clase equivalente puede considerarse como el nombre para otros
estímulos de la clase. Las relaciones posibles entre las clases de lenguaje y equivalencia son de interés
especial (Catania, Matthews, & Shimoff, 1990; Devany, Hayes, & Nelson, 1986; Dugdale & Lowe, 1990).
¿Son las clases equivalentes un prerrequisito para nombrar, o es el nombrar un prerrequisito para las
clases equivalentes? Posiblemente ninguna de las dos alternativas es apropiada: El lenguaje y las
equivalencias pueden ser dos aspectos de una única competencia conductual.
Las clases equivalentes son creadas dentro de procedimientos de igualación arbitraria. Para ser
funcionalmente equivalentes, los miembros de estas clases deben tener las mismas funciones no sólo
dentro de los procedimientos de igualación sino también en otros contextos. Un experimento de Vaughan
(1988) ofrece un ejemplo de equivalencia funcional. Se dividió un grupo de transparencias de fotos de
árboles en dos arreglos arbitrarios de 20 transparencias cada uno. Los picoteos de los pichones eran
reforzados dadas las transparencias de un arreglo mas no del otro. Ocasionalmente se cambiaba la
correlación entre los arreglos de transparencias y el reforzamiento. Después de varios cambios, los
pichones empezaron a cambiar sus respuestas de un arreglo al otro de transparencias después de que
sólo una pequeña porción de transparencias se había mostrado. En otras palabras, las contingencias
comunes arregladas para las 20 transparencias de un arreglo las hizo funcionalmente equivalentes: Una
vez que las contingencias cambiaron en sólo unas cuantas transparencias en el arreglo, el
comportamiento cambió apropiadamente para el resto. Nótese que esta equivalencia funcional emergió
porque se arreglaron las mismas consecuencias para las respuestas en presencia de todos los estímulos
en un arreglo; esto es diferente de la emergencia de relaciones de equivalencia en la igualación arbitraria.
Las transparencias en cada arreglo fueron funcionalmente equivalentes, pero eso no significa que eran
miembros de una clase equivalente (cf. Sidman, Wynne, Maguire, & Barnes, 1989).
En otras palabras, la equivalencia funcional no es lo mismo que la membresía en una clase equivalente, y
no debe asumirse que las propiedades lógicas de estas clases son totalmente consistentes con las clases
conductuales. La equivalencia funcional de los miembros de una clase equivalente debe ser probada
experimentalmente. La cuestión consiste en saber si alguna función adquirida por un miembro de una
clase equivalente, tal como una función discriminativa, se transferirá a los otros miembros de esa clase
equivalente.
El resultado es de gran importancia práctica. Considere un ejemplo. Un niño ha aprendido a obedecer las
palabras adelante y detente de su padre, cuando cruza con uno de sus padres una intersección de
tráfico. En un contexto separado, se le enseña al niño que adelante y la luz verde del semáforo son
equivalentes y que detente y la luz roja del semáforo son equivalentes (en otras palabras, adelante y
verde se convierten en miembros de una clase equivalente y detente y rojo se convierten en miembros de
otra). Si las funciones discriminativas de las palabras detente y adelante se transfieren a las señales de
tráfico correspondientes, el niño obedecerá las luces del semáforo sin ninguna instrucción adicional. Se
ha demostrado un tipo análogo de transferencia con niños: Tasas altas y bajas de respuesta ocasionadas
por un arreglo de estímulos transfirió a otro arreglo cuando los estímulos en los arreglos fueron hechos
miembros de clases equivalentes (Catania, Horne, & Lowe, 1989); ver también a DeRose, McIlvane,
Dube, Galpin, & Stoddard, 1988). Anteriormente mencionamos moldeamiento y desvanecimiento como
procedimientos para producir nuevo comportamiento; a través de la transferencia de función, las clases
equivalentes ofrecen una manera más de emergencia de nuevo comportamiento.
Las clases equivalentes demostradas por la reflexividad, simetría, y transitividad son obviamente
relevantes para la enseñanza de la lectura y otras aplicaciones humanas importantes. Estas clases no
son reducibles a clases de estímulos discriminativos, porque los estímulos discriminativos no pueden ser
intercambiados con las respuestas que ocasionan. Las clases equivalentes definen comportamiento
simbólico y serán importantes posteriormente en nuestro análisis del lenguaje. Introducimos un tipo de
clase de operante de orden superior en el Capítulo 6; ese tipo era definido por las consecuencias
comunes a sus miembros. Las clases equivalentes ofrecen otro tipo definido por relaciones entre
estímulos. Hasta el momento, no existe una taxonomía estándar de clases de comportamiento de orden
superior, pero si se desarrolla una, podremos muy bien definir dichas clases en términos de las clases de
relaciones de contingencia involucradas.
RESUMEN.
Iniciamos este capítulo con la exploración de paralelos entre diferenciación e inducción por una parte, y
discriminación y generalización por otra. Ambas son resultado de reforzamiento diferencial; su diferencia
principal consiste en si esta operación está arreglada para propiedades del estímulo o para propiedades
de la respuesta. Los aspectos funcionales del control del estímulo fueron tratados en el contexto de la
atención, gradientes de control del estímulo, y en procedimientos de desvanecimiento. Al tratar con las
propiedades discriminables del ambiente en el contexto de la cognición animal, consideramos entonces
de qué manera la complejidad de las características relacionales del ambiente podrían funcionar como
estímulos discriminativos. Los mapas cognitivos y los conceptos naturales proporcionaron ejemplos
relevantes.
Las clases de orden superior fueron introducidas en la discusión del arreglo de aprendizaje. Todos estos
casos pusieron énfasis en los estímulos, pero consideramos importante tratar esos estímulos en términos
de sus relaciones con las respuestas y sus consecuencias. El control discriminativo se basa en la
contingencia de tres términos: estímulo-respuesta-consecuencia. Ninguno de estos términos es
importante en aislamiento. Podemos hablar de reforzamiento diferencial con respecto a propiedades del
estímulo, o de la correlación de estímulos con contingencias, o de clases operantes definidas por los
estímulos que presentan la ocasión para las respuestas de una clase. Estas variaciones del lenguaje del
aprendizaje discriminativo simplemente enfatizan aspectos diferentes de la misma contingencia de tres
términos.
Pero en el contexto de las discriminaciones condicionales y la igualación a la muestra, llegamos a otra

clase de relación de control del estímulo no reducible a las contingencias de tres términos. Cuando se
demuestran la reflexividad, simetría, y transitividad por las muestras y comparaciones de procedimientos
de igualación estándar y arbitrarios, hablamos de dichos estímulos en términos de clases equivalentes, y
las distinguimos de las clases de estímulos discriminativos. Las clases equivalentes son la propiedad
definitoria del comportamiento simbólico. Nuevas clases de comportamiento emergen cuando la
equivalencia formal se convierte en equivalencia funcional.


Operante Discriminada PDF

Cargado por

Copyright:

Formatos disponibles

Operante Discriminada PDF

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Operante Discriminada PDF

Cargado por

Copyright:

Formatos disponibles

La Naturaleza de la Operante Discriminada 1

Operantes Discriminadas: Control de Estímulos

Seminario Interactum de Análisis del Comportamiento

OPERANTES DISCRIMINADAS: CONTROL DE ESTÍMULO 1

Los estímulos discriminativos corresponden a aquellos coloquialmente llamados señales o indicadores.

Sección A. La Naturaleza de las Operantes Discriminadas.

Seminario Interactum de Análisis del Comportamiento

dimensión correlacionada con reforzamiento: el Capítulo 6 se ocupó de una dimensión de la respuesta,

El concepto de atención surge de la respuesta discriminada a propiedades de los estímulos. Considere

La atención no es solamente un ejemplo de la generalización. Para el pichón 105, la respuesta se

Seminario Interactum de Análisis del Comportamiento

APRENDIZAJE DE LUGAR VS APRENDIZAJE DE RESPUESTA.

En ambientes naturales, el alimento en un lugar dado no es necesariamente abastecido de nuevo como

lo es en la caja meta de un laberinto de laboratorio. En la conducta de forrajeo, es más probable que un

GRADIENTES DE CONTROL DEL ESTÍMULO.

La metodología de los procedimientos de discriminación ponen una carga pesada en el experimentador.

Seminario Interactum de Análisis del Comportamiento

Seminario Interactum de Análisis del Comportamiento

Seminario Interactum de Análisis del Comportamiento

Seminario Interactum de Análisis del Comportamiento

DESVANECIMIENTO: CONTROL DEL ESTÍMULO POR APROXIMACIONES SUCESIVAS.

LOS VOCABULARIOS DE LA DIFERENCIACIÓN Y LA DISCRIMINACIÓN.

Tanto la diferenciación como la discriminación involucran reforzamiento diferencial. La principal diferencia

Seminario Interactum de Análisis del Comportamiento

REFORZAMIENTO CONCENTRACIÓN EXTENSIÓN DE LOS REFORZAMIENTO

Con respecto a propiedades de la

Con respecto a propiedades del

Seminario Interactum de Análisis del Comportamiento

Sección B Cognición Animal.

El campo de la cognición animal ha estado especialmente interesada con la identificación de las

CONCEPTOS NATURALES Y CLASES PROBABILÍSTICAS DE ESTÍMULO.

Seminario Interactum de Análisis del Comportamiento

Algunas clases probabilísticas de estímulo se definen con referencia a un prototipo. Un prototipo es un

Seminario Interactum de Análisis del Comportamiento

Sección C. Discriminaciones Condicionales y Clases de Comportamiento de Orden Superior.

Consideremos ahora algunos procedimientos experimentales en los que las contingencias de

El aprendizaje de una nueva discriminación puede modificarse por la historia de aprendizaje

Seminario Interactum de Análisis del Comportamiento

En este procedimiento, la operante discriminada no puede ser descrita simplemente en términos de un

Seminario Interactum de Análisis del Comportamiento

En este punto, podemos definir la operante discriminada de la siguiente manera: Si la respuesta a un

Un fenómeno que puede contemplarse como variación de un arreglo de aprendizaje es el desamparo

El arreglo de aprendizaje no solamente ilustra la amplitud y complejidad de las clases de estímulo y

Seminario Interactum de Análisis del Comportamiento

construirla desde el inicio o desde el final; etc.

Muchas discriminaciones condicionales involucran relaciones arbitrarias entre el estímulo discriminativo

Seminario Interactum de Análisis del Comportamiento

Una alternativa es modificar el procedimiento de igualación a la muestra, con la esperanza de realzar el

Existen muchas variaciones de igualación a la muestra. Si se arregla el reforzamiento para picoteos en la

COMPORTAMIENTO SIMBÓLICO: CLASES EQUIVALENTES.

Seminario Interactum de Análisis del Comportamiento

Ya hemos cuestionado si el desempeño de igualación estándar del pichón depende de la relación de

Seminario Interactum de Análisis del Comportamiento

Pero en el contexto de las discriminaciones condicionales y la igualación a la muestra, llegamos a otra

Seminario Interactum de Análisis del Comportamiento

También podría gustarte