ClubEnsayos.com - Ensayos de Calidad, Tareas y Monografias
Buscar

En la programación dinámica probabilística, el estado en la etapa siguiente nos queda completamente determinado por el estado y la decisión de la subpolítica en el estado actual


Enviado por   •  9 de Noviembre de 2015  •  Tarea  •  4.598 Palabras (19 Páginas)  •  871 Visitas

Página 1 de 19

EJERCICIOS

PROGRAMACIÓN DINÁMICA PROBABILÍSTICA

Octubre de 2015

Investigación de Operaciones II-Grupo 9 

Mónica Patricia Novoa      Cód: 20131020072

Angie Lorena Cárdenas    Cód: 20131020082

Steve Aguilar Uribe           Cód: 20122020032

  Angie Ortiz Giraldo           Cód: 20112020071

Objetivo: 

Proponer, plantear y desarrollar ejercicios de Programación Dinámica Probabilística  mostrando paso a paso el proceso para abordar y solucionar el problema planteado.

Programación Dinámica Probabilística:

En la programación dinámica probabilística, el estado en la etapa siguiente nos queda completamente determinado por el estado y la decisión de la subpolítica en el estado actual, sino que existe una distribución de probabilidad para lo que sería el estado siguiente

Carácter probabilístico: El carácter probabilístico se ve reflejado en que los retornos y estados adoptados en cada etapa tienen asociada una probabilidad de ocurrencia; esto quiere decir que el estado en la siguiente etapa no estará completamente determinado por el estado y la política de decisiones en la etapa actual, en cambio hay una distribución de probabilidad para determinar un grado probabilidad de ocurrencia en el estado siguiente basado en el estado y política del estado actual.  

Recursividad Los cálculos de programación dinámica se hacen en forma recursiva, ya que la solución óptima de un sub-problema se usa como condición inicial para el siguiente subproblema. Para cuando se resuelve el último subproblema queda a la mano la solución óptima de todo el problema la cual contempla una política de decisiones etapa a etapa, en donde considera el resultado obtenido (el cual depende de su probabilidad de ocurrencia y sobre él se construye dicha política).

Con las recursiones en avance y en reversa se obtiene la misma solución. Aunque el procedimiento en avance parece más lógico, en las publicaciones sobre programación dinámica se usa la recursión en reversa de modo invariable. La razón de esta preferencia es que, en general, la recursión en reversa es más eficiente, desde el punto de vista computacional

Algoritmo solución:

1)División del problema en subproblemas

2)Planteamiento de la relación recursiva

3) Inicio en la etapa n (siendo n un sub-problema), considerando las limitaciones que den lugar en dicha etapa, para tomar la decisión correspondiente, escogiendo aquella que represente el retorno óptimo

4) Desarrollar el problema hasta la n-ésima etapa reconstruyendo los retornos de acuerdo a la etapa  anterior

5)Desarrollar hasta la etapa 1 (generalmente se desarrolla en retroceso )y concluir con los retornos de las etapas anteriores para poder hallar la solución óptima de acuerdo con los requerimientos del problema

Ejercicios:

Pasos

Procedimiento

Ejercicio N° 1

Enunciado

Una joven emprendedora experta en estadística cree haber desarrollado un sistema para ganar un popular juego en Las vegas. Sus colegas no piensan que este sistema sea tan bueno, por lo que le apuestan que si comienza con tres fichas, ella no tendrá al menos cinco fichas después de tres jugadas. Cada jugada incluye apostar cualquier cantidad de las fichas disponibles y ganar o perder este mismo número de fichas. La joven cree que su sistema dará probabilidad de 2/3 de ganar una jugada dada.

Suponiendo que la experta estadística está en lo correcto se quiere usar programación dinámica para determinar su política óptima sobre cuántas fichas apostar (si apuesta alguna) en cada una de tres jugadas para determinar. La decisión en cada jugada deberá tomar en cuenta los resultados de las jugadas anteriores. El objetivo es maximizar la probabilidad de ganar la apuesta hecha a sus colegas:

Objetivo

Maximizar la probabilidad de que la joven gane la apuesta

Formulación

Etapas n=(1,2,3)

Xn= Número de fichas que debe apostar en la etapa n

Sn= Número de fichas que se tienen para comenzar la etapa n.

La función objetivo que debe maximizarse en cada etapa es la probabilidad con más de cinco fichas o con justo cinco fichas, ya que la apuesta se gana de las dos formas

fn(Sn,Xn)= Probabilidad de terminar las tres jugadas con cinco fichas o más.

Planteamiento matemático

[pic 1]

Dado que la joven comienza la etapa  n con con S fichas, su decisión inmediata es Xn y en adelante toma decisiones óptimas

[pic 2]

 [pic 3]

La expresión , refleja el hecho de que un momento dado es posible acumular aun cuando pierda en la siguiente jugada.[pic 4]

- Si pierde:

El estado en la siguiente será  y la probabilidad de terminar con menos de cinco fichas será .[pic 5]

- Si gana:

El estado del sistema será y la probabilidad correspondiente será [pic 6][pic 7]

Así, se supone que la probabilidad de ganar una jugada dada es , se concluye que:Etapa [pic 8]

n=3

[pic 9]

[pic 10]

[pic 11]

[pic 12]

0

0

-

1

0

-

2

0

-

3

[pic 13]

2 o 3

4

[pic 14]

1(o más)

[pic 15]

1

0

Etapa

n=2

[pic 16]

[pic 17]

[pic 18]

[pic 19]

[pic 20]

[pic 21]

0

1

2

3

4

0

0

0

-

1

0

0

0

-

2

0

4/9

4/9

4/9

1 o 2

3

[pic 22]

4/9

2/3

2/3

2/3

0,2 o 3

4

[pic 23]

8/9

2/3

2/3

2/3

8/9

1

[pic 24]

1

1

0

...

Descargar como (para miembros actualizados) txt (32 Kb) pdf (671 Kb) docx (408 Kb)
Leer 18 páginas más »
Disponible sólo en Clubensayos.com