{"product_id":"hands-on-guide-to-apache-spark-3-build-scalable-computing-engines-for-batch-and-stream-data-processing-9781484293799","title":"Guía práctica de Apache Spark 3: cree motores de computación escalables para el procesamiento de datos por lotes y en streaming","description":"Este libro explica cómo escalar Apache Spark 3 para manejar cantidades masivas de datos, ya sea mediante procesamiento por lotes o por streaming. Cubre cómo usar las API estructuradas de Spark para realizar transformaciones y análisis de datos complejos que puedes usar para implementar flujos de trabajo de análisis de extremo a extremo. Este libro cubre las nuevas características de Spark 3, los fundamentos teóricos y la arquitectura de la aplicación. La primera sección presenta el ecosistema de Apache Spark como un motor unificado para el análisis de datos a gran escala, y te muestra cómo ejecutar y ajustar tu primera aplicación en Spark. La segunda sección se centra en el procesamiento por lotes adecuado para el procesamiento de fin de ciclo y la ingesta de datos a través de archivos y bases de datos. Explica la API de Spark DataFrame, así como los datos estructurados y no estructurados con Apache Spark. La última sección trata sobre las cargas de trabajo de procesamiento de streaming escalables, de alto rendimiento y tolerantes a fallos para procesar datos en tiempo real. Aquí aprenderás sobre el modelo de ejecución de Apache Spark Streaming, la arquitectura de Spark Streaming, la monitorización, la elaboración de informes y la recuperación de Spark Streaming. Se dedica un capítulo completo a las futuras direcciones de Spark Streaming. Con casos de uso del mundo real, fragmentos de código y cuadernos alojados en GitHub, este libro te proporcionará una comprensión de los conceptos de análisis de datos a gran escala, y te ayudará a ponerlos en práctica.\u003cbr\u003eAl completar este libro, tendrás los conocimientos y habilidades para implementar sin problemas cargas de trabajo por lotes y de streaming a gran escala para analizar flujos de datos en tiempo real con Apache Spark.\u003cbr\u003e\u003cb\u003eLo que aprenderá\u003c\/b\u003e\u003cul\u003e\n\u003cli\u003eDominar los conceptos de clústeres de Spark y procesamiento de datos por lotes\u003c\/li\u003e\n\u003cli\u003eComprender la ingesta, transformación y almacenamiento de datos\u003c\/li\u003e\n\u003cli\u003eObtener una visión de los conceptos esenciales de procesamiento de flujos y las diferentes arquitecturas de streaming\u003c\/li\u003e\n\u003cli\u003eImplementar trabajos y aplicaciones de streaming con Spark Streaming\u003c\/li\u003e\n\u003c\/ul\u003e\u003cbr\u003e\u003cb\u003ePara quién es este libro\u003c\/b\u003eIngenieros de datos, analistas de datos, ingenieros de aprendizaje automático, programadores de Python y R\u003cbr\u003e\u003cbr\u003e\u003cb\u003eAutor:\u003c\/b\u003e \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=AUTH-15961534\"\u003eAlfonso Antolínez García\u003c\/a\u003e\u003cbr\u003e\u003cb\u003eEditorial:\u003c\/b\u003e Apress\u003cbr\u003e\u003cb\u003ePublicado:\u003c\/b\u003e 06\/06\/2023\u003cbr\u003e\u003cb\u003ePáginas:\u003c\/b\u003e 403\u003cbr\u003e\u003cb\u003eTipo de encuadernación:\u003c\/b\u003e Tapa blanda\u003cbr\u003e\u003cb\u003ePeso:\u003c\/b\u003e 1.60lbs\u003cbr\u003e\u003cb\u003eTamaño:\u003c\/b\u003e 10.00h x 7.00w x 0.86d\u003cbr\u003e\u003cb\u003eISBN13:\u003c\/b\u003e 9781484293799\u003cbr\u003e\u003cb\u003eISBN10:\u003c\/b\u003e 1484293797\u003cbr\u003e\u003cb\u003eCategorías BISAC:\u003c\/b\u003e\u003cbr\u003e- \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=CAT-COM\"\u003eComputadoras\u003c\/a\u003e | \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=BISAC-COM031000\"\u003eTeoría de la información\u003c\/a\u003e\u003cbr\u003e- \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=CAT-COM\"\u003eComputadoras\u003c\/a\u003e | \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=BISAC-COM004000\"\u003eInteligencia artificial | General\u003c\/a\u003e\u003cbr\u003e- \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=CAT-COM\"\u003eComputadoras\u003c\/a\u003e | \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=BISAC-COM051360\"\u003eLenguajes | Python\u003c\/a\u003e\u003cbr\u003e\u003cbr\u003e\u003cp\u003e\u003cb\u003eAcerca del autor\u003c\/b\u003e\u003cbr\u003e\u003cb\u003eAlfonso Antolínez García\u003c\/b\u003e es un gerente de TI senior con una larga trayectoria profesional en varias empresas multinacionales como Bertelsmann SE, Lafarge y TUI AG. Ha trabajado en la industria de los medios, la industria de los materiales de construcción y la industria del ocio. Alfonso también trabaja como profesor universitario, impartiendo clases de inteligencia artificial, aprendizaje automático y ciencia de datos. En su tiempo libre, escribe trabajos de investigación sobre inteligencia artificial, matemáticas, física y las aplicaciones de la teoría de la información a otras ciencias.\u003c\/p\u003e","brand":"Apress","offers":[{"title":"Default Title","offer_id":44569051594989,"sku":"9781484293799","price":69.99,"currency_code":"USD","in_stock":true}],"thumbnail_url":"\/\/cdn.shopify.com\/s\/files\/1\/0550\/8097\/6621\/products\/img_4554e975-652f-4f1d-9757-09204c04212a.jpg?v=1701916522","url":"https:\/\/sureshotbooks.com\/es\/products\/hands-on-guide-to-apache-spark-3-build-scalable-computing-engines-for-batch-and-stream-data-processing-9781484293799","provider":"SureShot Books Publishing LLC","version":"1.0","type":"link"}