{"product_id":"vision-language-pre-training-basics-recent-advances-and-future-trends-9781638281320","title":"Preentrenamiento Visión-Lenguaje: Fundamentos, Avances Recientes y Tendencias Futuras","description":"Los humanos perciben el mundo a través de muchos canales, como las imágenes vistas por los ojos o las voces escuchadas por los oídos. Aunque cualquier canal individual pueda ser incompleto o ruidoso, los humanos pueden alinear y fusionar naturalmente la información recopilada de múltiples canales para captar los conceptos clave necesarios para una mejor comprensión del mundo. Una de las principales aspiraciones de la Inteligencia Artificial (IA) es desarrollar algoritmos que doten a las computadoras de la capacidad de aprender eficazmente de datos multimodales (o multicanal). Estos datos son similares a las imágenes y sonidos obtenidos de la visión y el lenguaje que ayudan a los humanos a dar sentido al mundo que nos rodea. Por ejemplo, las computadoras podrían imitar esta capacidad buscando las imágenes más relevantes para una consulta de texto (o viceversa), y describiendo el contenido de una imagen usando lenguaje natural. La Visión y Lenguaje (VL), un área de investigación popular que se encuentra en la intersección de la Visión por Computadora y el Procesamiento del Lenguaje Natural (PNL), tiene como objetivo lograr este objetivo.\u003cstrong\u003e \u003c\/strong\u003eEsta monografía examina los métodos de preentrenamiento visión-lenguaje (VLP) para la inteligencia multimodal que se han desarrollado en los últimos años. Los enfoques se agrupan en tres categorías: (i) VLP para tareas de imagen-texto, como subtitulado de imágenes, recuperación de imagen-texto, respuesta a preguntas visuales y puesta a tierra visual; (ii) VLP para tareas centrales de visión por computadora, como clasificación de imágenes (de conjunto abierto), detección de objetos y segmentación; y (iii) VLP para tareas de video-texto, como subtitulado de videos, recuperación de video-texto y respuesta a preguntas de videos. Para cada categoría, se presenta una revisión exhaustiva de los métodos de vanguardia y se discuten los avances logrados y los desafíos que aún se enfrentan, utilizando sistemas y modelos específicos como estudios de caso. Además, para cada categoría, se presentan temas avanzados que se están explorando activamente en la comunidad de investigación, como los grandes modelos fundamentales, el modelado unificado, el aprendizaje en contexto de pocas tomas, el conocimiento, la robustez y la visión por computadora en entornos reales, por nombrar algunos.\u003cp\u003e\u003cbr\u003e\u003c\/p\u003e\u003cbr\u003e\u003cbr\u003e\u003cb\u003eAutor:\u003c\/b\u003e \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=AUTH-15826384\"\u003eZhe Gan\u003c\/a\u003e, \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=AUTH-15826385\"\u003eLinjie Li\u003c\/a\u003e, \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=AUTH-9311644\"\u003eChunyuan Li\u003c\/a\u003e\u003cbr\u003e\u003cb\u003eEditorial:\u003c\/b\u003e Now Publishers\u003cbr\u003e\u003cb\u003ePublicado:\u003c\/b\u003e 12\/05\/2022\u003cbr\u003e\u003cb\u003ePáginas:\u003c\/b\u003e 206\u003cbr\u003e\u003cb\u003eTipo de encuadernación:\u003c\/b\u003e Tapa blanda\u003cbr\u003e\u003cb\u003ePeso:\u003c\/b\u003e 0.65 lbs\u003cbr\u003e\u003cb\u003eTamaño:\u003c\/b\u003e 9.21 alto x 6.14 ancho x 0.44 profundidad\u003cbr\u003e\u003cb\u003eISBN13:\u003c\/b\u003e 9781638281320\u003cbr\u003e\u003cb\u003eISBN10:\u003c\/b\u003e 1638281327\u003cbr\u003e\u003cb\u003eCategorías BISAC:\u003c\/b\u003e\u003cbr\u003e- \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=CAT-COM\"\u003eInformática\u003c\/a\u003e | \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=BISAC-COM016000\"\u003eInteligencia Artificial | Visión por Computadora y Reconocimiento de Patrones\u003c\/a\u003e\u003cbr\u003e- \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=CAT-COM\"\u003eInformática\u003c\/a\u003e | \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=BISAC-COM012000\"\u003eDesarrollo e Ingeniería de Software | Gráficos por Computadora\u003c\/a\u003e\u003cbr\u003e","brand":"Now Publishers","offers":[{"title":"Default Title","offer_id":44584719220973,"sku":"9781638281320","price":132.0,"currency_code":"USD","in_stock":true}],"thumbnail_url":"\/\/cdn.shopify.com\/s\/files\/1\/0550\/8097\/6621\/products\/img_9f67622a-8d82-48d3-b5c8-511fa5c30ea7.jpg?v=1702149117","url":"https:\/\/sureshotbooks.com\/es\/products\/vision-language-pre-training-basics-recent-advances-and-future-trends-9781638281320","provider":"SureShot Books Publishing LLC","version":"1.0","type":"link"}