Anatomía De Una Decisión: Striato-orbitofrontal Interacciones Del Reforzamiento, Aprendizaje, Toma De Decisiones, Y Reversión

fdodiegoe14 de Junio de 2015

5.536 Palabras (23 Páginas)317 Visitas

Página 1 de 23

Anatomía de una decisión: Striato-orbitofrontal Interacciones del reforzamiento, aprendizaje, toma de decisiones, y reversión

Los autores exploran la división del trabajo entre el sistema de los ganglios basales-dopamina (BG-DA) y la corteza orbitofrontal (OFC) en la toma de decisiones. Ellos muestran que un modelo de red neuronal primitiva del sistema BG-DA poco a poco aprende a tomar decisiones sobre la base de la probabilidad relativa de las recompensas, pero no es tan sensible a (a) actualidad o (b) el valor de recompensas específicas. Un modelo aumentado que explora la interacción BG-OFC es más exitoso en la estimación del verdadero valor esperado de las decisiones y es más rápido al cambiar el comportamiento cuando las contingencias del refuerzo cambian. En el modelo ampliado, áreas de la OFC ejercer control de arriba abajo en las áreas de BG y premotoras mediante la representación de magnitudes de refuerzo en la memoria de trabajo. El modelo logró capturar los patrones de comportamiento que resultan de daños OFC en paradigmas de la toma de decisiones, el aprendizaje por reversión, y la devaluación de paradigmas y hace otras predicciones para la fuente subyacente de estos déficits.

¿Qué permite a los seres humanos tomar decisiones que conduzcan a ganancias a largo plazo, aun cuando tengan que incurrir en pérdidas a corto plazo? Dicha habilidad para toma de decisiones depende de los procesos de selección de la acción (elección de entre una de varias respuestas posibles) y el aprendizaje por refuerzo (modificación de la probabilidad de selección de una respuesta dada en la base de las consecuencias experimentadas). Aunque todos los mamíferos pueden aprender a asociar sus acciones con consecuencias, los seres humanos son particularmente avanzados en su capacidad para modificar la flexibilidad relativa a valores de refuerzo de las opciones alternativas para seleccionar más conductas adaptativas en un determinado comportamiento espacial, temporal y contexto.

Las neurociencias cognitivas y del comportamiento han identificado dos sistemas neurales que están implicados en el comportamiento de tales adaptaciones. Por una parte, los ganglios basales (BG) y el neuromodulador dopamina (DA) se cree que participan tanto en la selección de acciones y el aprendizaje por refuerzo (Beiser y Houk, 1998; Brown, Bullock, y Grossberg, 1999, 2004; Frank, 2005; Frank, Loughry, y O'Reilly, 2001; Gurney, Prescott, y Redgrave, 2001; Mink, 1996; O'Reilly & Frank, 2006). Los pacientes con enfermedad de Parkinson (PD), que tienen bajos niveles de DA en el BG, está alterada la toma de decisiones que requiere aprender por ensayo y error (se enfría, 2005; Knowlton,

Mangels, y Squire, 1996; Shohamy et al, 2004). Biológicamente basados en modelos computacionales muestran cómo el sistema de BG-DA puede aprender a tomar decisiones adaptativas (Brown et al, 2004;. Frank, 2005) y dar cuenta de cómo esta se ve afectada en PD (Frank, 2005).

Por otro lado, varias líneas de evidencia sugieren que las cortezas ventromedial y orbitofrontal son fundamentales para la toma de decisiones adaptativas en los seres humanos y que son zonas homólogas compatibles con más formas primitivas de este comportamiento en los animales (Kringelbach & Rolls, 2004; Rolls, 1996; Schoenbaum, Setlow, Saddoris, y Gallagher, 2003; Tremblay & Schultz, 2000). Los pacientes con daños en la corteza orbitofrontal (OFC) presentan déficits en la toma de decisiones en su vida cotidiana, que también han sido documentados en el laboratorio (Bechara, Damasio, Tranel, & Anderson, 1998). Los consumidores de drogas, que son casi por definición, pobres tomadores de decisiones, han reducido el metabolismo y el volumen de materia gris de la OFC (Milham et al, 2006.; Volkow, Fowler, y Wang, 2003). Por último, las lesiones de la OFC perjudican la propia capacidad para aprender cuando las asociaciones anteriores de recompensa ya no aplican, como en el aprendizaje por reversión (Chudasama y Robbins, 2003; Jones Y Mishkin, 1972). Así, ambos sistema de la BG-DA y OFC tienen implicaciones en la toma de decisiones, reforzamiento y aprendizaje por reversión, pero muy poco trabajo teórico aborda cómo estos sistemas están relacionados o interactúan. Dado que la OFC es una estructura reciente filogenéticamente, una pregunta razonable es "¿Qué única función es la OFC contribuir a la toma de decisiones que no está respaldada por el más primitivo sistema BG-DA?”.

En este artículo, se extenderá un modelo anterior de la red neuronal del sistema BG-DA (Frank, 2005) para explorar las contribuciones adicionales de la OFC que permite la toma adaptable y flexible de decisiones. En breve, esta explicación es coherente con la idea de que el sistema BG esta especializado para integrar poco a poco los resultados positivos y negativos de los ensayos múltiples, lo que resulta de inculcar hábitos motores (Jog, Kubota, Connolly, Hillegaart, y Graybiel, 1999). El modelo logra esto mediante la enseñanza para facilitar las respuestas que generalmente conducen a resultados positivos, mientras que al mismo tiempo aprender a suprimir respuestas inapropiadas (Frank, 2005). En contraste, la corteza prefrontal (PFC) mantiene activa la información en la memoria de trabajo a través de una descarga neural persistente (Fuster, 1997; Goldman-Rakic, 1995; Miller, Erickson, y Desimone, 1996), y esto tiene un efecto de desviación de arriba hacia abajo para guiar el comportamiento (JD Cohen, Dunbar, & McClelland, 1990; Miller y Cohen, 2001). Esta incorporación activa la información contextual reciente y puede complementan y competir con más representaciones latentes habituales (por ejemplo, Morton & Munakata, 2002). Además, este modelo se adhiere a una teoría dominante de la función de PFC, lo que sugiere que las áreas separadas dentro del PFC se distinguen principalmente por el tipo de información que se mantiene en la memoria de trabajo (Goldman-Rakic, 1995), con la OFC la representación de valores de recompensa (Elliott, Dolan, y Frith, 2000; Schoenbaum

Y Roesch, 2005; Schoenbaum y Setlow, 2001; Tremblay & Schultz, 1999). Áreas más específicas, medial y lateral de la OFC representan los resultados positivos y negativos de las decisiones, respectivamente (Gottfried, O'Doherty, y Dolan, 2002; O'Doherty, Kringelback, Rolls, Hornak, y Andrews, 2001; Rolls & Kringelbach, 2003; Ursu & Carter, 2005). El mantenimiento activo de esta información en la memoria de trabajo, estas áreas de la OFC tiene un efecto top-down de polarización en los procesos de selección de respuesta de la BG y la corteza premotora.

El resultado neto es que el sistema de BG-DA es muy adecuado para aprender a tomar decisiones en función de la probabilidad relativa que resulta en un resultado positivo, pero la OFC es necesaria para proporcionar activa la memoria de trabajo de las magnitudes relativas de la información de pérdidas y ganancias. La combinación de los dos sistemas resulta en una mejor representación del verdadero valor esperado de una decisión determinada. A través de simulaciones explícitas, nuestro modelo aumentado representa déficits en la toma de decisiones en pacientes OFC, haciendo predicciones específicas para los diferentes patrones de lesiones laterales versus lesiones mediales. Además, los mecanismos mismos de la OFC están soportados para poder rápidamente modificar las asociaciones de recompensa cuando éstos cambian de repente, como en el aprendizaje por reversión. Por último, la simulación de daños en OFC y estriatal en nuestro modelo produce anomalías de comportamiento cualitativamente similares a las observadas en estas poblaciones clínicas.

Debido a que nuestro objetivo principal es el desarrollo de un marco teórico para la comprensión de las contribuciones diferenciales neurales del sistema de toma de decisiones, se revisan los estudios con datos relevantes neuronales a través de las ratas y primates no humanos (por la que la grabación neural directa y los datos de las lesiones son abundantes) y humanos (sostiene que las funciones neuronales son similares en todas las especies). Estos datos convergentes restringen los mecanismos simulados en nuestro modelo, de manera que no es dependiente de un resultado individual de cualquier estudio en particular sino que incluye los resultados que se han observado a través de múltiples estudios y especies.

Anatomía de una decisión

Varias regiones del cerebro que interactúan participar en procesos de toma de decisiones, incluyendo pero no limitado a BG, la corteza parietal, PFC, y subdivisiones en ella, y tanto la corteza cingulada anterior y posterior (McCoy & Platt, 2005; Platt, 2002). Aquí se centrara en (a) en el sistema subcortical BG-DA y sus interacciones con la corteza premotora y (b) las cortezas ventromedial y orbitofrontal y su influencia de arriba hacia abajo en (a).

BG-DA

Nuestro marco para conceptualizar el papel de la BG en la toma de decisiones se basa en las sugerencias de Mink y otros (O. Hikosaka, 1998; Mink, 1996) sobre el papel de las mismas estructuras en el control motor. En particular, la BG se cree que modulan la selección de acciones se consideran en la corteza frontal (Brown et al, 2004;. Frank, 2005; Frank et al, 2001; Gurney et al, 2001; O. Hikosaka, 1998; Mink, 1996; Rubchinsky, Kopell, y Sigvardt, 2003). En concreto, dos vías de proyecciones principales del cuerpo estriado proceden a través de diferentes estructuras de salida de la BG al tálamo y a la corteza (Alexander & Crutcher, 1990a; Alexander, Crutcher, y DeLong, 1990; véase la figura 1a). La actividad en la vía directa envía

...

Descargar como (para miembros actualizados) txt (35 Kb)

Leer 22 páginas más »

Leer documento completo Guardar

Disponible sólo en Clubensayos.com