{"product_id":"modern-data-engineering-with-apache-spark-a-hands-on-guide-for-building-mission-critical-streaming-applications-9781484274514","title":"Ingeniería de datos moderna con Apache Spark: una guía práctica para crear aplicaciones de streaming de misión crítica","description":"Aproveche Apache Spark dentro de un ecosistema moderno de ingeniería de datos. Esta guía práctica le enseñará cómo escribir aplicaciones completamente funcionales, seguir las mejores prácticas de la industria y comprender la razón detrás de estas decisiones. Con Apache Spark como base, seguirá un viaje paso a paso que comienza con los conceptos básicos de ingesta, procesamiento y transformación de datos, y termina con una plataforma de datos local completa que ejecuta Apache Spark, Apache Zeppelin, Apache Kafka, Redis, MySQL, Minio (S3) y Apache Airflow. \u003cp\u003e\u003c\/p\u003eLas aplicaciones de Apache Spark resuelven una amplia gama de problemas de datos, desde la carga y procesamiento de datos tradicionales hasta análisis ricos basados en SQL, así como complejas cargas de trabajo de aprendizaje automático e incluso el procesamiento casi en tiempo real de datos de transmisión. Spark encaja bien como base central para cualquier carga de trabajo de ingeniería de datos. Este libro le enseñará a escribir aplicaciones Spark interactivas utilizando cuadernos de Apache Zeppelin, escribir y compilar aplicaciones y módulos reutilizables, y probar completamente tanto por lotes como por transmisión. También aprenderá a contenerizar sus aplicaciones utilizando Docker y a ejecutar e implementar sus aplicaciones Spark utilizando una variedad de herramientas como Apache Airflow, Docker y Kubernetes.\u003cp\u003eLa lectura de este libro le permitirá aprovechar Apache Spark para optimizar sus canalizaciones de datos y le enseñará a crear aplicaciones Spark modulares y comprobables. Creará e implementará aplicaciones Spark de transmisión de misión crítica en un entorno de bajo estrés que allanará el camino para su propio camino hacia la producción.\u003cbr\u003e\u003c\/p\u003e ​\u003cbr\u003e\u003cb\u003eLo que aprenderá\u003c\/b\u003e\u003cul\u003e\n\u003cli\u003eSimplifique la transformación de datos con Spark Pipelines y Spark SQL\u003cbr\u003e\n\u003c\/li\u003e\n\u003cli\u003eUna la ingeniería de datos con el aprendizaje automático\u003c\/li\u003e\n\u003cli\u003eDiseñe aplicaciones de canalización de datos modulares\u003cbr\u003e\n\u003c\/li\u003e \u003cli\u003eCree componentes y bibliotecas de aplicaciones reutilizables\u003c\/li\u003e \u003cli\u003eContenerice sus aplicaciones Spark para lograr coherencia y fiabilidad\u003c\/li\u003e\n\u003cli\u003eUtilice Docker y Kubernetes para implementar sus aplicaciones Spark\u003cbr\u003e\n\u003c\/li\u003e\n\u003cli\u003eAcelere la experimentación de aplicaciones utilizando Apache Zeppelin y Docker\u003c\/li\u003e \u003cli\u003eComprenda los datos estructurados serializables y los contratos de datos\u003c\/li\u003e \u003cli\u003eAproveche estrategias efectivas para optimizar los datos en sus lagos de datos\u003c\/li\u003e \u003cli\u003eCree aplicaciones de streaming estructurado de Spark de extremo a extremo utilizando Redis y Apache Kafka\u003c\/li\u003e \u003cli\u003eAdopte las pruebas para sus aplicaciones por lotes y de streaming\u003c\/li\u003e \u003cli\u003eImplemente y supervise sus aplicaciones Spark\u003c\/li\u003e \u003c\/ul\u003e \u003cbr\u003e\u003cb\u003eA quién va dirigido este libro\u003c\/b\u003e\u003cbr\u003eIngenieros de software profesionales que desean aplicar sus habilidades actuales a nuevas y emocionantes oportunidades dentro del ecosistema de datos, ingenieros de datos en ejercicio que buscan una guía mientras atraviesan los muchos desafíos de pasar de los modos por lotes a los de transmisión, arquitectos de datos que desean proporcionar una dirección clara y concisa sobre cómo aprovechar y usar mejor Apache Spark dentro de su organización, y aquellos interesados en los pormenores de convertirse en un ingeniero de datos moderno en el mundo acelerado y hambriento de datos de hoy.\u003cbr\u003e\u003cbr\u003e\u003cbr\u003e\u003cb\u003eAutor:\u003c\/b\u003e \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=AUTH-15321624\"\u003eScott Haines\u003c\/a\u003e\u003cbr\u003e\u003cb\u003eEditorial:\u003c\/b\u003e Apress\u003cbr\u003e\u003cb\u003ePublicado:\u003c\/b\u003e 23\/03\/2022\u003cbr\u003e\u003cb\u003ePáginas:\u003c\/b\u003e 585\u003cbr\u003e\u003cb\u003eTipo de encuadernación:\u003c\/b\u003e Tapa blanda\u003cbr\u003e\u003cb\u003ePeso:\u003c\/b\u003e 2,31 libras\u003cbr\u003e\u003cb\u003eTamaño:\u003c\/b\u003e 10,00 alto x 7,00 ancho x 1,24 profundidad\u003cbr\u003e\u003cb\u003eISBN13:\u003c\/b\u003e 9781484274514\u003cbr\u003e\u003cb\u003eISBN10:\u003c\/b\u003e 1484274512\u003cbr\u003e\u003cb\u003eCategorías BISAC:\u003c\/b\u003e\u003cbr\u003e- \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=CAT-COM\"\u003eInformática\u003c\/a\u003e | \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=BISAC-COM051280\"\u003eLenguajes | Java\u003c\/a\u003e\u003cbr\u003e- \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=CAT-MAT\"\u003eMatemáticas\u003c\/a\u003e | \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=BISAC-MAT029000\"\u003eProbabilidad y Estadística | General\u003c\/a\u003e\u003cbr\u003e- \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=CAT-COM\"\u003eInformática\u003c\/a\u003e | \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=BISAC-COM021000\"\u003eAdministración y Gestión de Bases de Datos\u003c\/a\u003e\u003cbr\u003e\u003cbr\u003e\u003cp\u003e\u003cb\u003eSobre el autor\u003c\/b\u003e\u003cbr\u003e\u003cb\u003e​\u003c\/b\u003e\u003cb\u003eScott Haines \u003c\/b\u003ees un ingeniero full stack con un enfoque actual en sistemas de análisis en tiempo real, de alta disponibilidad y confiables. Trabaja en Twilio como ingeniero de software principal en el equipo de Voice Insights, donde ayuda a impulsar la adopción de Spark, crea arquitecturas de canalización de transmisión y ayuda a diseñar y construir una plataforma masiva de procesamiento de transmisión y por lotes.\u003cbr\u003eAntes de Twilio, Scott trabajó escribiendo las API Java de backend para Yahoo Games, así como el motor de clasificación y calificación de juegos en tiempo real (construido sobre Storm) para proporcionar recomendaciones personalizadas y visitas a la página para 10 millones de clientes. Terminó su período en Yahoo trabajando para Flurry Analytics, donde escribió el sistema de alertas y notificaciones para dispositivos móviles.\u003c\/p\u003e\u003cp\u003e\u003ci\u003eEste título no es retornable\u003c\/i\u003e\u003cbr\u003e\u003c\/p\u003e","brand":"Apress","offers":[{"title":"Default Title","offer_id":44543262392557,"sku":"9781484274514","price":64.99,"currency_code":"USD","in_stock":true}],"thumbnail_url":"\/\/cdn.shopify.com\/s\/files\/1\/0550\/8097\/6621\/products\/img_7660f2f0-56ef-4904-a9a3-358dda528bdc.jpg?v=1701540307","url":"https:\/\/sureshotbooks.com\/es\/products\/modern-data-engineering-with-apache-spark-a-hands-on-guide-for-building-mission-critical-streaming-applications-9781484274514","provider":"SureShot Books Publishing LLC","version":"1.0","type":"link"}