Descripción
La toma de decisiones secuencial, comúnmente formalizada como optimización de Procesos de Decisión de Markov (MDP), es un desafío importante en la inteligencia artificial. Dos enfoques clave para este problema son el aprendizaje por refuerzo (RL) y la planificación. Esta monografía presenta una integración de ambos campos, más conocida como aprendizaje por refuerzo basado en modelos. El RL basado en modelos tiene dos pasos principales: aprendizaje del modelo dinámico e integración planificación-aprendizaje. En esta exhaustiva revisión del tema, los autores cubren primero el aprendizaje del modelo dinámico, incluyendo desafíos como el tratamiento de la estocasticidad, la incertidumbre, la observabilidad parcial y la abstracción temporal. Luego presentan una categorización sistemática de la integración planificación-aprendizaje, incluyendo aspectos como: dónde iniciar la planificación, qué presupuestos asignar a la planificación y a la recolección de datos reales, cómo planificar y cómo integrar la planificación en el bucle de aprendizaje y actuación. Para concluir, los autores discuten el RL implícito basado en modelos como una alternativa de extremo a extremo para el aprendizaje y la planificación de modelos, y cubren los beneficios potenciales del RL basado en modelos. A lo largo del camino, los autores establecen conexiones con varios campos relacionados del RL, incluyendo el RL jerárquico y el aprendizaje por transferencia. Esta monografía contiene una amplia visión conceptual de la combinación de planificación y aprendizaje para la optimización de Procesos de Decisión de Markov. Proporciona una introducción clara y completa al tema tanto para estudiantes como para investigadores.
Autor: Thomas M. Moerland, Joost Broekens, Aske Plaat
Editorial: Now Publishers
Publicado: 01/04/2023
Páginas: 132
Tipo de encuadernación: Tapa blanda
Peso: 0.43 libras
Tamaño: 9.21 pulgadas alto x 6.14 pulgadas ancho x 0.28 pulgadas profundidad
ISBN13: 9781638280569
ISBN10: 1638280568
Categorías BISAC:
- Informática | Teoría de la Máquina
- Informática | Ciencia de Datos | Aprendizaje Automático
Autor: Thomas M. Moerland, Joost Broekens, Aske Plaat
Editorial: Now Publishers
Publicado: 01/04/2023
Páginas: 132
Tipo de encuadernación: Tapa blanda
Peso: 0.43 libras
Tamaño: 9.21 pulgadas alto x 6.14 pulgadas ancho x 0.28 pulgadas profundidad
ISBN13: 9781638280569
ISBN10: 1638280568
Categorías BISAC:
- Informática | Teoría de la Máquina
- Informática | Ciencia de Datos | Aprendizaje Automático

