Descripción
De Bandits a la Búsqueda en Árbol de Monte-Carlo: El Principio Optimista Aplicado a la Optimización y Planificación cubre varios aspectos del principio de "optimismo ante la incertidumbre" para problemas de optimización a gran escala con un presupuesto numérico finito. La motivación inicial de la monografía provino del éxito empírico del llamado método de "Búsqueda en Árbol de Monte-Carlo" popularizado en Computer Go y luego extendido a muchos otros juegos, así como a problemas de optimización y planificación. Establece las bases teóricas del campo caracterizando la complejidad de los problemas de optimización y diseñando algoritmos eficientes con garantías de rendimiento. La dirección principal seguida en esta monografía consiste en descomponer un problema complejo de toma de decisiones (como un problema de optimización en un gran espacio de búsqueda) en una secuencia de decisiones elementales, donde cada decisión de la secuencia se resuelve utilizando un "bandido multi-brazo" estocástico (modelo matemático para la toma de decisiones en entornos estocásticos). Esto define una búsqueda jerárquica que posee la agradable característica de comenzar la exploración mediante un muestreo casi uniforme del espacio y luego enfocarse, a diferentes escalas, en las áreas más prometedoras (utilizando el principio optimista) hasta eventualmente realizar una búsqueda local alrededor de los óptimos globales de la función. Esta monografía considera el problema de la optimización de funciones en espacios de búsqueda generales (como espacios métricos, espacios estructurados, árboles y grafos) así como el problema de la planificación en procesos de decisión de Markov. Su principal contribución es una clase de algoritmos optimistas jerárquicos con diferentes instanciaciones algorítmicas dependiendo de si las evaluaciones son ruidosas o sin ruido y si se conoce o se desconoce alguna medida de la ''suavidad'' local de la función alrededor del máximo global.
Autor: Remi Munos
Editorial: Now Publishers
Publicado: 31/01/2014
Páginas: 146
Tipo de encuadernación: Tapa blanda
Peso: 0.47lbs
Tamaño: 9.21h x 6.14w x 0.31d
ISBN13: 9781601987662
ISBN10: 1601987668
Categorías BISAC:
- Matemáticas | Optimización
- Computadoras | Ciencias de la computación
- Computadoras | Teoría de la máquina
Autor: Remi Munos
Editorial: Now Publishers
Publicado: 31/01/2014
Páginas: 146
Tipo de encuadernación: Tapa blanda
Peso: 0.47lbs
Tamaño: 9.21h x 6.14w x 0.31d
ISBN13: 9781601987662
ISBN10: 1601987668
Categorías BISAC:
- Matemáticas | Optimización
- Computadoras | Ciencias de la computación
- Computadoras | Teoría de la máquina

