{"product_id":"high-performance-spark-best-practices-for-scaling-and-optimizing-apache-spark-9781491943205","title":"Spark de alto rendimiento: Mejores prácticas para escalar y optimizar Apache Spark","description":"\u003cp\u003eApache Spark es asombroso cuando todo funciona a la perfección. Pero si no ha visto las mejoras de rendimiento que esperaba, o aún no se siente lo suficientemente seguro como para usar Spark en producción, este libro práctico es para usted. Los autores Holden Karau y Rachel Warren demuestran optimizaciones de rendimiento para ayudar a que sus consultas de Spark se ejecuten más rápido y manejen tamaños de datos más grandes, utilizando menos recursos.\u003c\/p\u003e\u003cp\u003eIdeal para ingenieros de software, ingenieros de datos, desarrolladores y administradores de sistemas que trabajan con aplicaciones de datos a gran escala, este libro describe técnicas que pueden reducir los costos de infraestructura de datos y las horas de desarrollador. No solo obtendrá una comprensión más completa de Spark, sino que también aprenderá cómo sacarle el máximo partido.\u003c\/p\u003e\u003cp\u003eCon este libro, explorará: \u003c\/p\u003e\u003cul\u003e\n\u003cli\u003eCómo las nuevas interfaces de Spark SQL mejoran el rendimiento sobre la estructura de datos RDD de SQL\u003c\/li\u003e\n\u003cli\u003eLa elección entre uniones de datos en Core Spark y Spark SQL\u003c\/li\u003e\n\u003cli\u003eTécnicas para aprovechar al máximo las transformaciones RDD estándar\u003c\/li\u003e\n\u003cli\u003eCómo solucionar problemas de rendimiento en el paradigma de pares clave\/valor de Spark\u003c\/li\u003e\n\u003cli\u003eCómo escribir código Spark de alto rendimiento sin Scala ni la JVM\u003c\/li\u003e\n\u003cli\u003eCómo probar la funcionalidad y el rendimiento al aplicar las mejoras sugeridas\u003c\/li\u003e\n\u003cli\u003eUso de las bibliotecas de aprendizaje automático Spark MLlib y Spark ML\u003c\/li\u003e\n\u003cli\u003eComponentes de transmisión de Spark y paquetes comunitarios externos\u003c\/li\u003e\n\u003c\/ul\u003e\u003cbr\u003e\u003cbr\u003e\u003cb\u003eAutor:\u003c\/b\u003e \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=AUTH-7317280\"\u003eHolden Karau\u003c\/a\u003e, \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=AUTH-2219105\"\u003eRachel Warren\u003c\/a\u003e\u003cbr\u003e\u003cb\u003eEditorial:\u003c\/b\u003e O'Reilly Media\u003cbr\u003e\u003cb\u003ePublicado:\u003c\/b\u003e 06\/16\/2017\u003cbr\u003e\u003cb\u003ePáginas:\u003c\/b\u003e 358\u003cbr\u003e\u003cb\u003eTipo de encuadernación:\u003c\/b\u003e Tapa blanda\u003cbr\u003e\u003cb\u003ePeso:\u003c\/b\u003e 1.20lbs\u003cbr\u003e\u003cb\u003eTamaño:\u003c\/b\u003e 9.20h x 7.00w x 0.70d\u003cbr\u003e\u003cb\u003eISBN13:\u003c\/b\u003e 9781491943205\u003cbr\u003e\u003cb\u003eISBN10:\u003c\/b\u003e 1491943203\u003cbr\u003e\u003cb\u003eCategorías BISAC:\u003c\/b\u003e\u003cbr\u003e- \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=CAT-COM\"\u003eComputadoras\u003c\/a\u003e | \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=BISAC-COM018000\"\u003eCiencia de Datos | General\u003c\/a\u003e\u003cbr\u003e- \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=CAT-COM\"\u003eComputadoras\u003c\/a\u003e | \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=BISAC-COM021030\"\u003eCiencia de Datos | Análisis de Datos\u003c\/a\u003e\u003cbr\u003e- \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=CAT-COM\"\u003eComputadoras\u003c\/a\u003e | \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=BISAC-COM051390\"\u003eProgramación | Código Abierto\u003c\/a\u003e\u003cbr\u003e\u003cbr\u003e\u003cp\u003e\u003cb\u003eAcerca del autor\u003c\/b\u003e\u003cbr\u003e\u003c\/p\u003e\u003cp\u003eHolden Karau es una mujer transgénero canadiense y una activa colaboradora de código abierto. Cuando no está en San Francisco trabajando como ingeniera de desarrollo de software en el Centro de Tecnología Spark de IBM, Holden da charlas internacionales sobre Apache Spark y atiende consultas en cafeterías en casa y en el extranjero. Es una contribuidora frecuente de Spark, especializándose en PySpark y Aprendizaje Automático. Antes de IBM, trabajó en una variedad de problemas distribuidos, de búsqueda y clasificación en Alpine, Databricks, Google, Foursquare y Amazon. Se graduó de la Universidad de Waterloo con una Licenciatura en Matemáticas en Ciencias de la Computación. Fuera del software, le gusta jugar con fuego, soldar, los patinetes, la poutine y bailar.\u003c\/p\u003e\u003cp\u003eRachel Warren es científica de datos e ingeniera de software en Alpine Data Labs, donde utiliza Spark para abordar desafíos de procesamiento de datos del mundo real. Tiene experiencia trabajando como analista tanto en la industria como en la academia. Se graduó con un título en Ciencias de la Computación de la Universidad Wesleyan en Connecticut.\u003c\/p\u003e","brand":"O'Reilly Media","offers":[{"title":"Default Title","offer_id":42679969349869,"sku":"9781491943205","price":49.99,"currency_code":"USD","in_stock":true}],"thumbnail_url":"\/\/cdn.shopify.com\/s\/files\/1\/0550\/8097\/6621\/products\/img_9675617b-ebf7-4eef-a52c-6fb9b0ecb647.jpg?v=1649689319","url":"https:\/\/sureshotbooks.com\/es\/products\/high-performance-spark-best-practices-for-scaling-and-optimizing-apache-spark-9781491943205","provider":"SureShot Books Publishing LLC","version":"1.0","type":"link"}