{"product_id":"regret-analysis-of-stochastic-and-nonstochastic-multi-armed-bandit-problems-9781601986269","title":"Análisis de Arrepentimiento de Problemas de Bandidos Multibrazo Estocásticos y No Estocásticos","description":"Un problema de bandido multi-brazo - o, simplemente, un problema de bandido - es un problema de asignación secuencial definido por un conjunto de acciones. En cada paso de tiempo, se asigna un recurso unitario a una acción y se obtiene una recompensa observable. El objetivo es maximizar la recompensa total obtenida en una secuencia de asignaciones. El nombre bandido se refiere al término coloquial para una máquina tragaperras (un \"bandido de un solo brazo\" en la jerga americana). En un casino, se obtiene un problema de asignación secuencial cuando el jugador se enfrenta a muchas máquinas tragaperras a la vez (un \"bandido multi-brazo\"), y debe elegir repetidamente dónde insertar la siguiente moneda. Los problemas de bandido multi-brazo son los ejemplos más básicos de problemas de decisión secuencial con un compromiso entre exploración y explotación. Este es el equilibrio entre quedarse con la opción que dio las mayores recompensas en el pasado y explorar nuevas opciones que podrían dar mayores recompensas en el futuro. Aunque el estudio de los problemas de bandido se remonta a la década de 1930, los compromisos entre exploración y explotación surgen en varias aplicaciones modernas, como la colocación de anuncios, la optimización de sitios web y el enrutamiento de paquetes. Matemáticamente, un bandido multi-brazo se define por el proceso de recompensa asociado a cada opción. En este libro, el enfoque está en dos casos extremos en los que el análisis del arrepentimiento es particularmente simple y elegante: recompensas independientes e idénticamente distribuidas y recompensas adversarias. Además del escenario básico de un número finito de acciones, también analiza algunas de las variantes y extensiones más importantes, como el modelo de bandido contextual. Esta monografía es una referencia ideal para estudiantes e investigadores interesados en los problemas de bandido.\u003cbr\u003e\u003cbr\u003e\u003cb\u003eAutor:\u003c\/b\u003e \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=AUTH-6862630\"\u003eS. Bastian Bubeck\u003c\/a\u003e, \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=AUTH-16540081\"\u003eNicolo Cesa-Bianchi\u003c\/a\u003e, \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=AUTH-6943494\"\u003eSebastien Bubeck\u003c\/a\u003e\u003cbr\u003e\u003cb\u003eEditorial:\u003c\/b\u003e Now Publishers\u003cbr\u003e\u003cb\u003ePublicado:\u003c\/b\u003e 12\/12\/2012\u003cbr\u003e\u003cb\u003ePáginas:\u003c\/b\u003e 138\u003cbr\u003e\u003cb\u003eTipo de encuadernación:\u003c\/b\u003e Tapa blanda\u003cbr\u003e\u003cb\u003ePeso:\u003c\/b\u003e 0.45lbs\u003cbr\u003e\u003cb\u003eTamaño:\u003c\/b\u003e 9.21h x 6.14w x 0.30d\u003cbr\u003e\u003cb\u003eISBN13:\u003c\/b\u003e 9781601986269\u003cbr\u003e\u003cb\u003eISBN10:\u003c\/b\u003e 1601986262\u003cbr\u003e\u003cb\u003eCategorías BISAC:\u003c\/b\u003e\u003cbr\u003e- \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=CAT-COM\"\u003eInformática\u003c\/a\u003e | \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=BISAC-COM004000\"\u003eInteligencia Artificial | General\u003c\/a\u003e\u003cbr\u003e- \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=CAT-COM\"\u003eInformática\u003c\/a\u003e | \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=BISAC-COM014000\"\u003eCiencias de la Computación\u003c\/a\u003e\u003cbr\u003e- \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=CAT-MAT\"\u003eMatemáticas\u003c\/a\u003e | \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=BISAC-MAT029000\"\u003eProbabilidad y Estadística | General\u003c\/a\u003e\u003cbr\u003e","brand":"Now Publishers","offers":[{"title":"Default Title","offer_id":44573859184877,"sku":"9781601986269","price":120.0,"currency_code":"USD","in_stock":true}],"thumbnail_url":"\/\/cdn.shopify.com\/s\/files\/1\/0550\/8097\/6621\/products\/img_771ccae0-d219-49ad-aa0e-1016c76d9375.jpg?v=1701978981","url":"https:\/\/sureshotbooks.com\/es\/products\/regret-analysis-of-stochastic-and-nonstochastic-multi-armed-bandit-problems-9781601986269","provider":"SureShot Books Publishing LLC","version":"1.0","type":"link"}