Anatomía De Una Decisión: Striato-orbitofrontal Interacciones Del Reforzamiento, Aprendizaje, Toma De Decisiones, Y Reversión
Enviado por fdodiegoe • 14 de Junio de 2015 • 5.536 Palabras (23 Páginas) • 267 Visitas
Anatomía de una decisión: Striato-orbitofrontal Interacciones del reforzamiento, aprendizaje, toma de decisiones, y reversión
Los autores exploran la división del trabajo entre el sistema de los ganglios basales-dopamina (BG-DA) y la corteza orbitofrontal (OFC) en la toma de decisiones. Ellos muestran que un modelo de red neuronal primitiva del sistema BG-DA poco a poco aprende a tomar decisiones sobre la base de la probabilidad relativa de las recompensas, pero no es tan sensible a (a) actualidad o (b) el valor de recompensas específicas. Un modelo aumentado que explora la interacción BG-OFC es más exitoso en la estimación del verdadero valor esperado de las decisiones y es más rápido al cambiar el comportamiento cuando las contingencias del refuerzo cambian. En el modelo ampliado, áreas de la OFC ejercer control de arriba abajo en las áreas de BG y premotoras mediante la representación de magnitudes de refuerzo en la memoria de trabajo. El modelo logró capturar los patrones de comportamiento que resultan de daños OFC en paradigmas de la toma de decisiones, el aprendizaje por reversión, y la devaluación de paradigmas y hace otras predicciones para la fuente subyacente de estos déficits.
¿Qué permite a los seres humanos tomar decisiones que conduzcan a ganancias a largo plazo, aun cuando tengan que incurrir en pérdidas a corto plazo? Dicha habilidad para toma de decisiones depende de los procesos de selección de la acción (elección de entre una de varias respuestas posibles) y el aprendizaje por refuerzo (modificación de la probabilidad de selección de una respuesta dada en la base de las consecuencias experimentadas). Aunque todos los mamíferos pueden aprender a asociar sus acciones con consecuencias, los seres humanos son particularmente avanzados en su capacidad para modificar la flexibilidad relativa a valores de refuerzo de las opciones alternativas para seleccionar más conductas adaptativas en un determinado comportamiento espacial, temporal y contexto.
Las neurociencias cognitivas y del comportamiento han identificado dos sistemas neurales que están implicados en el comportamiento de tales adaptaciones. Por una parte, los ganglios basales (BG) y el neuromodulador dopamina (DA) se cree que participan tanto en la selección de acciones y el aprendizaje por refuerzo (Beiser y Houk, 1998; Brown, Bullock, y Grossberg, 1999, 2004; Frank, 2005; Frank, Loughry, y O'Reilly, 2001; Gurney, Prescott, y Redgrave, 2001; Mink, 1996; O'Reilly & Frank, 2006). Los pacientes con enfermedad de Parkinson (PD), que tienen bajos niveles de DA en el BG, está alterada la toma de decisiones que requiere aprender por ensayo y error (se enfría, 2005; Knowlton,
Mangels, y Squire, 1996; Shohamy et al, 2004). Biológicamente basados en modelos computacionales muestran cómo el sistema de BG-DA puede aprender a tomar decisiones adaptativas (Brown et al, 2004;. Frank, 2005) y dar cuenta de cómo esta se ve afectada en PD (Frank, 2005).
Por otro lado, varias líneas de evidencia sugieren que las cortezas ventromedial y orbitofrontal son fundamentales para la toma de decisiones adaptativas en los seres humanos y que son zonas homólogas compatibles con más formas primitivas de este comportamiento en los animales (Kringelbach & Rolls, 2004; Rolls, 1996; Schoenbaum, Setlow, Saddoris, y Gallagher, 2003; Tremblay & Schultz, 2000). Los pacientes con daños en la corteza orbitofrontal (OFC) presentan déficits en la toma de decisiones en su vida cotidiana, que también han sido documentados en el laboratorio (Bechara, Damasio, Tranel, & Anderson, 1998). Los consumidores de drogas, que son casi por definición, pobres tomadores de decisiones, han reducido el metabolismo y el volumen de materia gris de la OFC (Milham et al, 2006.; Volkow, Fowler, y Wang, 2003). Por último, las lesiones de la OFC perjudican la propia capacidad para aprender cuando las asociaciones anteriores de recompensa ya no aplican, como en el aprendizaje por reversión (Chudasama y Robbins, 2003; Jones Y Mishkin, 1972). Así, ambos sistema de la BG-DA y OFC tienen implicaciones en la toma de decisiones, reforzamiento y aprendizaje por reversión, pero muy poco trabajo teórico aborda cómo estos sistemas están relacionados o interactúan. Dado que la OFC es una estructura reciente filogenéticamente, una pregunta razonable es "¿Qué única función es la OFC contribuir a la toma de decisiones que no está respaldada por el más primitivo sistema BG-DA?”.
En este artículo, se extenderá un modelo anterior de la red neuronal del sistema BG-DA (Frank, 2005) para explorar las contribuciones adicionales de la OFC que permite la toma adaptable y flexible de decisiones. En breve, esta explicación es coherente con la idea de que el sistema BG esta especializado para integrar poco a poco los resultados positivos y negativos de los ensayos múltiples, lo que resulta de inculcar hábitos motores (Jog, Kubota, Connolly, Hillegaart, y Graybiel, 1999). El modelo logra esto mediante la enseñanza para facilitar las respuestas que generalmente conducen a resultados positivos, mientras que al mismo tiempo aprender a suprimir respuestas inapropiadas (Frank, 2005). En contraste, la corteza prefrontal (PFC) mantiene activa la información en la memoria de trabajo a través de una descarga neural persistente (Fuster, 1997; Goldman-Rakic, 1995; Miller, Erickson, y Desimone, 1996), y esto tiene un efecto de desviación de arriba hacia abajo para guiar el comportamiento (JD Cohen, Dunbar, & McClelland, 1990; Miller y Cohen, 2001). Esta incorporación activa la información contextual reciente y puede complementan y competir con más representaciones latentes habituales (por ejemplo, Morton & Munakata, 2002). Además, este modelo se adhiere a una teoría dominante de la función de PFC, lo que sugiere que las áreas separadas dentro del PFC se distinguen principalmente por el tipo de información que se mantiene en la memoria de trabajo (Goldman-Rakic, 1995), con la OFC la representación de valores de recompensa (Elliott, Dolan, y Frith, 2000; Schoenbaum
Y Roesch, 2005; Schoenbaum y Setlow, 2001; Tremblay & Schultz, 1999). Áreas más específicas, medial y lateral de la OFC representan los resultados positivos y negativos de las decisiones, respectivamente (Gottfried, O'Doherty, y Dolan, 2002; O'Doherty, Kringelback, Rolls, Hornak, y Andrews, 2001; Rolls & Kringelbach, 2003; Ursu & Carter, 2005). El mantenimiento activo de esta información en la memoria de trabajo, estas áreas de la OFC tiene un efecto top-down de polarización en los procesos de selección de respuesta de la BG y la corteza premotora.
El resultado neto es que el sistema de BG-DA es muy adecuado para aprender a tomar decisiones en función de la probabilidad relativa
...