jueves, 3 de diciembre de 2009

Condicionamiento instrumental

Condicionamiento instrumental
En psicología, el condicionamiento instrumental es una forma de aprendizaje en la que la consecuencia (el estímulo reforzador) es contingente a la respuesta que previamente ha emitido el sujeto. Se le llamó en principio "operante" porque el organismo opera sobre el medio para recibir una consecuencia.
El nombre que B.F. Skinner dio a este tipo de aprendizaje fue condicionamiento operante, aunque hoy se prefiere el de condicionamiento instrumental, por ser más descriptivo, aunque hay quien ve algún matiz distintivo desde posiciones puramente conductistas. Fue él precisamente el primero en distinguir entre este tipo de condicionamiento y el condicionamiento clásico.
Distinción entre condicionamiento clásico y operante
• En el condicionamiento clásico la asociación se da entre un estímulo condicionado y uno incondicionado. En el condicionamiento instrumental, la asociación se da entre las respuestas y las consecuencias que se derivan de ellas.
• En el condicionamiento clásico, el estímulo incondicionado no depende de la respuesta del sujeto, mientras que, en el operante, las consecuencias dependen de la respuesta del sujeto.
• En el condicionamiento clásico, la respuesta del sujeto es involuntaria, mientras que en el instrumental es generalmente voluntaria.
La distinción entre ambos condicionamientos para los conductistas más radicales es tanto operativa como de procesos:
• Operativa, ya que el reforzador depende de la respuesta, de la conducta, por tanto.
• Procesual, estando implicado en un caso el sistema nervioso autónomo y en el otro el sistema nervioso central. Esta diferencia no ha sido demostrada experimentalmente.
Estímulos
Lo verdaderamente importante en este tipo de condicionamiento es la respuesta generada ante el estímulo. Cualquier proceso de condicionamiento instrumental admite el uso de estímulos que en condicionamiento pavloviano podrían clasificarse como condicionados, incondicionados o neutros, ya que el análisis no se concentra en ellos sino en las consecuencias de las respuestas, que son las que determinan la probabilidad de que la conducta se repita o no.
En el condicionamiento instrumental los estímulos incondicionados se usan igual que en el pavloviano. El estímulo incondicionado (EI) es el resultado que sigue a la respuesta (por ejemplo comida, descargas eléctricas...)
También se usan estímulos condicionados (EC), estímulos relativamente inocuos sin significado o poder específico, al menos al comienzo del entrenamiento.
El estímulo discriminativo es un estímulo neutro que indica cuándo la respuesta puede conducir o no a la consecuencia deseada. Es decir, el estímulo discriminativo indica si el reforzador está disponible. Por oposición, el estímulo delta es el estímulo que no estuvo presente cuando la respuesta fue reforzada, y por lo tanto no da información sobre la disponibilidad del reforzador.
Respuestas
La respuesta incondicionada (RI) es la provocada por el EI de forma refleja y que viene determinada por él.
La respuesta condicionada (también llamada respuesta instrumental) suele ser distinta a la RI, siendo bastante arbitraria.
Fases
Las fases de un experimento de condicionamiento instrumental son esencialmente las mismas que en el caso del condicionamiento clásico:
• Adquisición
• Extinción
Programas de reforzamiento
Un programa de reforzamiento es una regla sobre la administración del reforzador. Existen programas de reforzamiento de dos tipos: de razón (en función de la respuesta) y de intervalo (en función del tiempo), y cada uno admite una administración fija o variable.
• En un programa de razón fija se administra un reforzador cada cierto número de respuestas. Un programa RF1, por ejemplo, da un reforzador por cada respuesta. El RF2 da un reforzador por cada dos respuestas.
• El programa de razón variable administra reforzadores cada cierto número de respuestas. Pero en este caso, este número no es fijo, sino que varía alrededor de un promedio. RV3 da una respuesta cada 2, 3 ó 4 respuestas, aproximadamente (y aleatoriamente).
• Un programa de intervalo fijo implica un período siempre igual durante el cual no hay disponibilidad del reforzador, período que se inicia justo después de la presentación de la respuesta criterio (es decir, aquella de interés). El hecho de que el sujeto emita o no respuesta alguna durante el transcurso del intervalo no modifica el ritmo de administración de los reforzadores.
• El programa de intervalo variable hace que el período durante el cual no está disponible el reforzador cambie alrededor de un promedio.
Por lo general, los programas de tasa (razón) producen una adquisición más rápida, pero fácilmente extinguible una vez suspendida la administración de reforzadores; y los de intervalo producen una adquisición más estable y resistente a la extinción.
Tipos
Existen cuatro procedimientos o tipos de condicionamiento instrumental:
• Condicionamiento de recompensa
• Entrenamiento de omisión
• Castigo
• Escape y evitación (Aunque distintos, ambos se consideran dentro del mismo procedimiento, ya que ambos implican la no ocurrencia del estímulo incondicionado aversivo.)

No hay comentarios:

Publicar un comentario en la entrada