{"product_id":"deep-reinforcement-learning-9789811906374","title":"Aprendizaje profundo por refuerzo","description":"Contents1 Introducción . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11.1 ¿Qué es el aprendizaje profundo por refuerzo? . . . . . . . . . . . . . . . . . . . . 11.2 Tres paradigmas del aprendizaje automático . . . . . . . . . . . . . . . . . . . . . . . 121.3 Resumen del libro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172 Métodos tabulares basados en valores . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232.1 Problemas de decisión secuencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 252.2 Agentes tabulares basados en valores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 272.3 Entornos de gimnasio clásicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 552.4 Resumen y lecturas adicionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 572.5 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 603 Aproximación de la función de valor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 633.1 Problemas grandes y de alta dimensión . . . . . . . . . . . . . . . . . . . . . . . . . . . 663.2 Agentes profundos basados en valores . . . . . . . . . . . . . . . . . . . . . . . . . . . . 693.3 Entornos Atari 2600 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 833.4 Resumen y lecturas adicionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 863.5 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 874 Métodos basados en políticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 894.1 Problemas continuos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 914.2 Agentes basados en políticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 944.3 Entornos de locomoción y visuo-motores . . . . . . . . . . . . . . . . . . . . . . . . 1114.4 Resumen y lecturas adicionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1154.5 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1165 Métodos basados en modelos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1195.1 Modelos dinámicos de problemas de alta dimensión . . . . . . . . . . . . . . . 1225.2 Agentes de aprendizaje y planificación . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1235.3 Entornos de alta dimensión . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1365.4 Resumen y lecturas adicionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142viiviii CONTENIDO5.5 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1446 Aprendizaje por refuerzo con dos agentes . . . . . . . . . . . . . . . . . . . . . . . . . 1476.1 Problemas de suma cero con dos agentes . . . . . . . . . . . . . . . . . . . . . . . . . 1506.2 Agentes de autoaprendizaje tabula rasa . . . . . . . . . . . . . . . . . . . . . . . . . . . 1566.3 Entornos de autoaprendizaje . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1786.4 Resumen y lecturas adicionales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1866.5 Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1887 Aprendizaje por refuerzo multiagente . . . . . . . . . . . . . . . . . . . . . . . . . . . .\u003cbr\u003e\u003cbr\u003e\u003cb\u003eAutor:\u003c\/b\u003e \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=AUTH-5646476\"\u003eAske Plaat\u003c\/a\u003e\u003cbr\u003e\u003cb\u003eEditorial:\u003c\/b\u003e Springer\u003cbr\u003e\u003cb\u003ePublicado:\u003c\/b\u003e 12\/06\/2022\u003cbr\u003e\u003cb\u003ePáginas:\u003c\/b\u003e 406\u003cbr\u003e\u003cb\u003eTipo de encuadernación:\u003c\/b\u003e Tapa blanda\u003cbr\u003e\u003cb\u003ePeso:\u003c\/b\u003e 1.30 lbs\u003cbr\u003e\u003cb\u003eTamaño:\u003c\/b\u003e 9.21h x 6.14w x 0.86d\u003cbr\u003e\u003cb\u003eISBN13:\u003c\/b\u003e 9789811906374\u003cbr\u003e\u003cb\u003eISBN10:\u003c\/b\u003e 9811906378\u003cbr\u003e\u003cb\u003eCategorías BISAC:\u003c\/b\u003e\u003cbr\u003e- \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=CAT-COM\"\u003eComputadoras\u003c\/a\u003e | \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=BISAC-COM004000\"\u003eInteligencia Artificial | General\u003c\/a\u003e\u003cbr\u003e- \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=CAT-COM\"\u003eComputadoras\u003c\/a\u003e | \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=BISAC-COM014000\"\u003eCiencias de la computación\u003c\/a\u003e\u003cbr\u003e\u003cbr\u003e\u003cp\u003e\u003cb\u003eAcerca del autor\u003c\/b\u003e\u003cbr\u003eAske Plaat es profesor de Ciencia de Datos en la Universidad de Leiden y director científico del Instituto de Ciencias de la Computación Avanzadas de Leiden (LIACS). Es cofundador del Centro de Ciencia de Datos de Leiden (LCDS) e inició SAILS, un programa multidisciplinario sobre inteligencia artificial. Sus intereses de investigación incluyen el aprendizaje por refuerzo, los juegos combinatorios y los sistemas de autoaprendizaje. Es autor de Learning to Play (publicado por Springer en 2020), que cubre específicamente el aprendizaje por refuerzo y los juegos.\u003c\/p\u003e\u003cp\u003e\u003ci\u003eEste título no es retornable\u003c\/i\u003e\u003cbr\u003e\u003c\/p\u003e","brand":"Springer","offers":[{"title":"Default Title","offer_id":44586120085741,"sku":"9789811906374","price":89.98,"currency_code":"USD","in_stock":true}],"thumbnail_url":"\/\/cdn.shopify.com\/s\/files\/1\/0550\/8097\/6621\/products\/img_d96287f0-f49e-48cc-b7d3-e0067fbc0563.jpg?v=1702173668","url":"https:\/\/sureshotbooks.com\/es\/products\/deep-reinforcement-learning-9789811906374","provider":"SureShot Books Publishing LLC","version":"1.0","type":"link"}