Descripción
El aprendizaje por refuerzo (RL) ofrecerá uno de los mayores avances en IA durante la próxima década, permitiendo que los algoritmos aprendan de su entorno para lograr objetivos arbitrarios. Este emocionante desarrollo evita las limitaciones que se encuentran en los algoritmos tradicionales de aprendizaje automático (ML). Este libro práctico muestra a los profesionales de la ciencia de datos y la IA cómo aprender por refuerzo y permitir que una máquina aprenda por sí misma.
El autor Phil Winder de Winder Research cubre todo, desde los bloques de construcción básicos hasta las prácticas de vanguardia. Explorará el estado actual de RL, se centrará en aplicaciones industriales, aprenderá numerosos algoritmos y se beneficiará de capítulos dedicados a la implementación de soluciones de RL en producción. Este no es un libro de cocina; no rehúye las matemáticas y espera familiaridad con ML.
- Aprenda qué es RL y cómo los algoritmos ayudan a resolver problemas
- Afianzarse en los fundamentos de RL, incluidos los procesos de decisión de Markov, la programación dinámica y el aprendizaje por diferencia temporal
- Profundice en una variedad de métodos de gradiente de valor y política
- Aplicar soluciones avanzadas de RL como metaaprendizaje, aprendizaje jerárquico, multiagente y aprendizaje por imitación
- Comprenda los algoritmos de RL profundo de vanguardia, incluidos Rainbow, PPO, TD3, SAC y más
- Obtenga ejemplos prácticos a través del sitio web adjunto
Autor: D. Phil Winder Ph.
Editorial: O'Reilly Media
Publicado: 12/01/2020
Páginas: 408
Tipo de encuadernación: Tapa blanda
Peso: 1.43lbs
Tamaño: 9.19h x 7.00w x 0.84d
ISBN13: 9781098114831
ISBN10: 1098114833
Categorías BISAC:
- Informática | Software de Negocio y Productividad | Inteligencia de Negocio
- Informática | Ciencia de Datos | Aprendizaje Automático
- Informática | Teoría de Máquinas
Sobre el Autor
El Dr. Phil Winder es un ingeniero de software y científico de datos multidisciplinar. Como director ejecutivo de Winder Research, una consultora de ciencia de datos nativa de la nube con sede en el Reino Unido, ayuda a las startups y empresas a utilizar la ciencia de datos. A través de una combinación de consultoría y desarrollo, pueden crecer y escalar su negocio mejorando sus productos y plataformas.
Durante los últimos 5 años, Phil ha enseñado a miles de ingenieros sobre ciencia de datos en su gama de cursos de capacitación en ciencia de datos en conferencias, en público, en privado y en la plataforma de aprendizaje en línea Safari. En estos cursos, Phil se enfoca en la practicidad del uso de la ciencia de datos en la industria en una amplia gama de temas, desde la limpieza de datos hasta el aprendizaje por refuerzo profundo.

