Programas básicos de reforzamiento

Enviado por Programa Chuletas y clasificado en Psicología y Sociología

Escrito el en español con un tamaño de 18,73 KB

 


Aristóteles, de asociación: semejanza, contraste y frecuencia contigua de ideas.

Autocontrol (frente a impulsividad):


Elección de un reforzador grande demorado frente a la elección más natural de reforzadores pequeños inmediatos (impulsividad). El peso de la inmediatez de la recompensa influye normalmente más en la conducta que la magnitud del reforzador (siguiendo el principio de contigüidad temporal), una forma de contrarrestarlo es demorar aunque sea brevemente el reforzador pequeño, resultando en que esperar un poco más para un premio mayor se vuelve más atractivo. El valorde los reforzadores basado en las carácterísticas de magnitud y demora se puede cuantificar siguiendo un modelo hiperbólico.

Bloqueo


Efecto de interferencia que se produce sobre el aprendizaje de una asociación EC-EI debido a un aprendizaje previo.

Clase de estímulos


Estímulos que varían en distintas carácterísticas físicas pero que tienen el mismo efecto sobre la conducta.

Clase de respuestas


Cualquier forma de ejecución de una conducta que tiene una función similar.

Condicionamiento clásico o pavloviano:


Tipo de aprendizaje que se produce cuando se presentan dos estímulos con independencia de la conducta del sujeto.

Condicionamiento de orden superior


Tipo de procedimiento en el que se utiliza un estimulo previamente condicionado para condicionar un nuevo estimulo.


Condicionamiento Excitatorio


Tipo de condicionamiento en el que se da una contingencia positiva entre la aparición del EC y la aparición del EI. La presentación repetida del EI tras el EC provoca una RC similar a la RI.

Condicionamiento Inhibitorio


Tipo de condicionamiento en el que se da una contingencia negativa entre la aparición del EC y la aparición del EI, por lo que el EC no provoca una RC similar a la RI.

Conducta de elección


Elegir entre dos opciones. Aplicación de programas de reforzamiento concurrentes.

Conducta elicitada


Conducta que es provocada por estímulos específicos del entorno. Este tipo de conductas pueden ser innatas o aprendidas como sucede en el condicionamiento clásico.

Conducta supersticiosa


Explicada por Skinner mediante la idea del reforzamiento accidental o adventicio. Otros autores la atribuyen a factores filogenéticos.

Conductismo:


neoconductismo (como en C. L. Hull) y conductismo radical (B. F. Skinner), o la más actual entre conductismo molar y molecular.

Constructo hipotético


No observacional. No se pueden demostrar, no son directamente manipulables y se infieren de la observación de la conducta.

Contracondicionamiento:


Tipo de procedimiento que se utiliza para variar o invertir la respuesta condicionada anterior utilizando un EI distinto al utilizado previamente.

Contraste conductual negativo


Disminución de la respuesta que tiene lugar cuando se presenta una recompensa desfavorable con respecto a una experiencia anterior con una consecuencia más favorable.

Contraste conductual positivo


Aumento de la respuesta debido a una recompensa favorable como resultado de la experiencia anterior con una recompensa menos favorable.

Control por el estímulo


Termino que se refiere a como los estímulos que preceden una conducta pueden controlar la ocurrencia de esa conducta.

Deriva instintiva


Tendencia de algunos animales a mostrar respuestas instintivas que compiten con la respuesta requerida cuando son entrenados mediante procedimientos de condicionamiento operante.

Desplazamiento del máximo


Efecto de interacción entre el control excitatorio e inhibitorio presente en cada estimulo de prueba cuando el entrenamiento de discriminación ha sido intradimensional. El resultado es que el máximo de respuestas no se observa en presencia del E+ original sino ante otro estimulo cuyo valor en la dimensión pertinente se aleja del E+ en dirección opuesta al E-.

Devaluación del reforzador


Procedimiento que consiste en asociar al reforzador que se está utilizando un estimulo o evento de naturaleza contraria. El efecto resultante de este procedimiento es una disminución de la respuesta operante que ha sido reforzada con el reforzador devaluado, aunque esta respuesta nunca haya sido contingente al estimulo aversivo.


Efecto de tendencia central


Desplazamiento del máximo de respuestas respecto al E+ original como efecto de la distribución respecto a este de los estímulos generalizados presentados. Se observa que el sujeto responde en mayor proporción ante un valor diferente al E+ original que se acerca al valor medio de los estímulos de prueba a los que se le expone.

Ensayos discretos y Operante libre


Se considera que un estudio está utilizando ensayos discretos cuando sólo se permite que la respuesta aparezca una vez por ensayo. De esta manera el experimentador puede controlar el momento y la frecuencia de emisión de la operante
.
El uso de un método de operante libre implica que el sujeto pueda repetir la respuesta sin restricciones a lo largo de la sesíón, sin que el experimentador intervenga al finalizar cada ensayo.

Estímulo Condicional vs. Estímulo Condicionado


Se denominan Estímulos CondicionaDOS a aquellos eventos que han adquirido alguna propiedad elicitadora por su emparejamiento con otro estimulo que ya poseía esa carácterística, ya sea un Estimulo Incondicionado (EI) u otro Estimulo Condicionado (EC).

Los estímulos CondicionaLES, sin embargo, son eventos cuyo control sobre la conducta es operante, no Respondiente (Clásico o Pavloviano). Son aquellos eventos que modifican la función positiva o negativa de los estímulos discriminativos, es decir, los eventos que anaden un término mas a la contingencia operante mínima de tres términos, convirtiéndola en condicional.

Estímulo discriminativo vs. Discriminar / Generalizar


Discriminar o generalizar son dos formas de describir el grado en el que ciertos estímulos antecedentes ejercen control sobre determinadas conductas.

Filogenia y Ontogenia


La filogénesis del comportamiento se refiere a los cambios producidos en el repertorio conductual innato de una especie debido a procesos de selección natural. La ontogénesis del comportamiento, sin embargo, alude a los cambios en el repertorio conductual de un individuo generados por su experiencia.

Funciones de retroalimentación


Son descripciones de las posibles relaciones existentes entre aspectos ambientales relacionados con la ocurrencia del reforzador (por ejemplo, su frecuencia de ocurrencia) y aspectos de ejecución conductual (como puede ser, por ejemplo, la frecuencia de ocurrencia de la respuesta). Por lo general en los programas de razón se encuentran funciones lineales, mientras que en los programas de intervalo se encuentran funciones hiperbólicas. Las funciones de retroalimentación se corresponden con una explicación molar de las relaciones del ambiente con la conducta.

Gradiente de generalización


Es la representación grafica del control de un estimulo sobre determinada conducta. Se forma a partir de la respuesta del sujeto ante estímulos que difieren del original solo en el valor de uno de sus rasgos, frecuentemente comprendiendo valores tanto superiores como inferiores. La forma del gradiente aporta información tanto de la naturaleza del control, excitatorio (U invertida) o inhibitorio (U); como de su nivel, alta generalización (plano) o baja (acusado). Los gradientes de generalización se forman a partir de la respuesta observada ante estímulos de prueba que guardan un parecido decreciente con el E+ o el E- en una dimensión (manteniéndose el resto de rasgos constantes). La forma de este gradiente (plano o puntiagudo) nos informa sobre el grado de control que ejerce el E+ o el E- sobre determinada conducta. Por tanto, nos permite determinar tanto el nivel de discriminación como de generalización.


ISI e ITI


Se define como intervalo entre estímulos (inter stimulus interval, ISI) al tiempo que transcurre entre la aparición de un determinado estímulo (frecuentemente un EC) y la aparición de otro (frecuentemente un EI). El intervalo entre ensayos (inter trial interval, ITI) es el tiempo que transcurre desde la finalización de un ensayo (al cerrarse el comedero, por ejemplo) y el comienzo del siguiente. Suele ser más largo que el ISI.

Ley de igualación


Es una relación matemática que establece una equiparación entre la tasa relativa de respuesta entre las alternativas existentes en un programa concurrente y la tasa relativa de reforzamiento que acompaña la elección de dichas alternativas de respuesta. La conducta de elección predicha por la ley de igualación se ha visto influida por factores como los sesgos de respuesta y la sensibilidad a las consecuencias de reforzamiento, lo que ha llevado a su reformulación matemática dando lugar a la ley generalizada de la igualación.

Magnitud de la RC


Medida del tamaño, vigor o extensión de una respuesta.

Mejoramiento


Teoría propuesta para explicar la elección en programas concurrentes de reforzamiento y basada en la idea de que siempre se responderá para mejorar la tasa local de reforzamiento, dando como resultado la igualación al equipararse las tasas locales de reforzamiento fruto de que a las alternativas de respuesta se les darán respuestas, se obtendrán reforzadores y se les dedicará un tiempo que estarán en proporción al reforzamiento disponible en dichas opciones de respuesta. El mejoramiento es una alternativa teórica que tiene elementos molares y moleculares de explicación de la conducta.


Precondicionamiento sensorial


Procedimiento que se utiliza para asociar dos estímulos biológicamente débiles.

Preexposición al EC o inhibición latente


Interferencia sobre el aprendizaje de una asociación debida a la preexposición del EC implicado en la misma.
Programas (y teoría) de reforzamiento diferencial de tiempos entre respuestas: Se puede reforzar específicamente que se separen las respuestas entre sí por un tiempo mínimo RDB (un programa de reforzamiento diferencial de tasas bajas de respuesta) o por un tiempo máximo RDA (un programa de reforzamiento diferencial de tasas altas de respuesta), lo que genera respectivamente responder lenta o rápidamente. Este reforzamiento diferencial de los tiempos entre respuestas se piensa que está involucrado en la ejecución de todos los programas de reforzamiento aunque específicamente no se hubiesen programado así, y responde a un tipo de explicación carácterístico de una aproximación teórica molecular (frente a la explicación de tipomolar).

Programas básicos de reforzamiento


Son reglas que determinan cómo se reforzarán las respuestas, destacando cuatro programas fundamentales: razón fija, razón variable, intervalo fijo e intervalo variable. La diferencia entre ellos se basa en el criterio de si se reforzará la respuesta que completa un número determinado de respuestas o la respuesta dada después de haber pasado un tiempo especificado, criterio que tanto en un caso como en otro puede ser fijo o puede variar de una ocasión a la siguiente. Los programas de razón mantienen por lo general tasas de respuesta más altas que los de intervalo, y los programas fijos, a diferencia de los variables, generan pausas post-reforzamiento


Programas compuestos secuenciales de reforzamiento


Hace referencia a la presentación en sucesión de al menos dos programas básicos de reforzamiento, destacando los programas mixto, múltiple, tándem y encadenado, cuya diferencia radica en cómo se pasa de uno a otro de los programas componentes y si existe señal discriminativa para los mismos.

Prueba del estímulo compuesto o prueba de sumación


Procedimiento de prueba que sirve para identificar un inhibidor condicionado si ese estímulo reduce la respuesta elicitada por un estímulo excitatorio.

Prueba del retraso en la adquisición


Procedimiento de prueba que sirve para identificar un inhibidor condicionado si dicho estímulo necesita más ensayos para adquirir propiedades excitatorias que un estímulo neutro.
Pseudocondicionamiento: Incremento de la respuesta que se da por un pro¬ceso no asociativo.

REc:


abreviatura de respuesta emocional condicionada.


Respuesta Condicionada (RC):


Respuesta que provoca un EC tras ser asociado a un EI y que generalmente es similar a la RI.

Respuesta condicional (Rc

)
: respuesta que se obtiene ante el EC tras su con¬dicionamiento.
Respuesta emocional condicionada o supresión condicionada: supresión de una conducta instrumental apetitiva provocada por la presentación de un estímulo que se ha asociado con un estímulo aversivo.

Respuesta Incondicionada (RI):


Respuesta que provoca un EI, sin necesidad de un entrenamiento previo.

Respuesta incondicional (RI):


respuesta que se obtiene tras la presentación de un estímulo sin entrenamiento previo.

Sensibilidad al reforzador


Estimación de cuanto una carácterística de reforzamiento influye en su efecto, de manera que no todas las variables que definen a los reforzadores (como su frecuencia o magnitud) contribuyen lo mismo a determinar el valor de los mismos, ni tienen el mismo valor para todos los individuos. Estimar la influencia relativa de una carácterística de reforzamiento en relación a otras, y con referencia a cada sujeto, es importante para poder determinar las preferencias en pruebas de elección como las de los programas concurrentes. Un parámetro de sensibilidad es incorporado a la ley generalizada de la igualación para poder explicar por qué en ocasiones la mejor alternativa es preferida por encima de lo que objetivamente vale (sobreigualación)
y en muchas otras es preferida por debajo de lo que vale (infraigualación).


Teoría de la privación de respuesta


Propuesta teórica que matiza el principio del reforzamiento de Premack al postular que lo único necesario para que una actividad pueda funcionar como reforzadora es restringir su ocurrencia con respecto a su óptimo (ahora denominado punto de bienestar), pero que no es necesario establecer ninguna jerarquía de preferencias para saber si las actividades instrumental y reforzadora son diferencialmente preferidas.

Teoría de la probabilidad diferencial


También conocida como principio de Premack, y por la que se propone que para que una actividad pueda funcionar como reforzadora debe ser preferida sobre la actividad que se quiere reforzar y hacerla posible sólo de forma contingente a la realización previa de la conducta instrumental, para lo cual habrá que restringir su ocurrencia en relación a los niveles óptimos de preferencia (pues si no estuviese restringida dicha actividad no podría funcionar como reforzadora).

Variable interviniente o intermedia


Es una variable que no se refiere a factores de causa o efecto pero que modifica (interviene) en las relaciones de otras variables, lo que aplicado a la teoría psicológica sería suponer la intervención de procesos no directamente observables pero que se pueden hacer operacionales con el fin de ser manipulados experimentalmente.


Ecs excitarorios apetitivos-esperanza
Ecs excitatorios aversivos-ansiedad
Ecs inhibitorios apetitivos-tristeza
Ecs inhibitorios aversivos-alivio

Intervalo entre ensayos ITI. Principio 1ensayo-principio 2ensayo
Intervalo entre estímulos. Principio 1estimulo- principio 2estimulo
Intervalo de huella. Final 1estumilo-principio 2estimulo
Latencia de RC. Principio de estimulo-principio respuesta


a: si EC – si EI b:

si EC – no EI c:

no EC – si EI d:

  No EC – no EI
P1 =a/(a+b). P(EI/EC)probabilidad de que se dé el EI después del EC /P0 = c / (c+d). P(EI/EC)
probabilidad de que se dé el EI tras la NO aparición del EC:/ ΔP = (a/a+b)-(c/c+d). P(EI/EC)+P(EI/noEC) índice resultante del cálculo de la contingencia, puede estar entre -1 y 1
Es positiva si ΔP > 0 /Perfecta si ΔP = 1 /Nula si ΔP = 0 /Negativa si ΔP <>

Modelo Rescorla-Wagner

ΔV
:

incremento de la fuerza asociativa entre EC y EI/ ΔVn:
incremento de la fuerza asociativa entre EC y EI en un ensayo “n”/ α β:

saliencia del EC y el EI, constantes durante el aprendizaje. Entre 0 y 1.
Habitualmente α (EC) = 0,5 y β (EI) =1

Λ:



Magnitud del EI

Si detrás del EC aparece el EI λ=1 (asíntota). Si no aparece λ=0 / Vn-1:
fuerza asociativa entre EC-EI adquirida en el ensayo anterior de condicionamiento. Entre 0 y 1/ V = Vn-1 + AVn fuerza asociativa neta
El cálculo del incremento de la fuerza asociativa es por tanto AVn= α β (λ+Vn-1)

ΣVn-1:


Se usa cuando hay varios ECs presentados en conjunto, para tener en cuenta la influencia de todos sobre el condicionamiento.
La fórmula queda: AV= α β (λ+EVn-1)

Entradas relacionadas: