{"product_id":"learning-spark-lightning-fast-data-analytics-9781492050049","title":"Aprendiendo Spark: Análisis de datos a la velocidad del rayo","description":"\u003cp\u003eLos datos son más grandes, llegan más rápido y en una variedad de formatos, y todo ello debe procesarse a escala para análisis o aprendizaje automático. Pero, ¿cómo se pueden procesar cargas de trabajo tan variadas de manera eficiente? Presentamos Apache Spark.\u003c\/p\u003e\u003cp\u003eActualizada para incluir Spark 3.0, esta segunda edición muestra a los ingenieros y científicos de datos por qué la estructura y la unificación en Spark son importantes. Específicamente, este libro explica cómo realizar análisis de datos simples y complejos y emplear algoritmos de aprendizaje automático. A través de tutoriales paso a paso, fragmentos de código y cuadernos, podrás:\u003c\/p\u003e\u003cul\u003e\n\u003cli\u003eAprender las API estructuradas de alto nivel de Python, SQL, Scala o Java\u003c\/li\u003e\n\u003cli\u003eComprender las operaciones de Spark y el motor SQL\u003c\/li\u003e\n\u003cli\u003eInspeccionar, ajustar y depurar las operaciones de Spark con las configuraciones de Spark y la interfaz de usuario de Spark\u003c\/li\u003e\n\u003cli\u003eConectarse a fuentes de datos: JSON, Parquet, CSV, Avro, ORC, Hive, S3 o Kafka\u003c\/li\u003e\n\u003cli\u003eRealizar análisis en datos por lotes y de transmisión utilizando Structured Streaming\u003c\/li\u003e\n\u003cli\u003eConstruir canalizaciones de datos confiables con Delta Lake de código abierto y Spark\u003c\/li\u003e\n\u003cli\u003eDesarrollar canalizaciones de aprendizaje automático con MLlib y poner modelos en producción utilizando MLflow\u003c\/li\u003e\n\u003c\/ul\u003e\u003cbr\u003e\u003cbr\u003e\u003cb\u003eAutor:\u003c\/b\u003e \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=AUTH-3977879\"\u003eJules S. Damji\u003c\/a\u003e, \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=AUTH-12678964\"\u003eBrooke Wenig\u003c\/a\u003e, \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=AUTH-12678965\"\u003eTathagata Das\u003c\/a\u003e\u003cbr\u003e\u003cb\u003eEditorial:\u003c\/b\u003e O'Reilly Media\u003cbr\u003e\u003cb\u003ePublicado:\u003c\/b\u003e 11\/08\/2020\u003cbr\u003e\u003cb\u003ePáginas:\u003c\/b\u003e 400\u003cbr\u003e\u003cb\u003eTipo de encuadernación:\u003c\/b\u003e Tapa blanda\u003cbr\u003e\u003cb\u003ePeso:\u003c\/b\u003e 1.40 libras\u003cbr\u003e\u003cb\u003eTamaño:\u003c\/b\u003e 9.20h x 7.00w x 0.90d\u003cbr\u003e\u003cb\u003eISBN13:\u003c\/b\u003e 9781492050049\u003cbr\u003e\u003cb\u003eISBN10:\u003c\/b\u003e 1492050040\u003cbr\u003e\u003cb\u003eCategorías BISAC:\u003c\/b\u003e\u003cbr\u003e- \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=CAT-COM\"\u003eComputadoras\u003c\/a\u003e | \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=BISAC-COM018000\"\u003eCiencia de Datos | General\u003c\/a\u003e\u003cbr\u003e- \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=CAT-COM\"\u003eComputadoras\u003c\/a\u003e | \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=BISAC-COM005000\"\u003eSoftware Empresarial y de Productividad | General\u003c\/a\u003e\u003cbr\u003e- \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=CAT-COM\"\u003eComputadoras\u003c\/a\u003e | \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=BISAC-COM051280\"\u003eLenguajes | Java\u003c\/a\u003e\u003cbr\u003e\u003cbr\u003e\u003cp\u003e\u003cb\u003eAcerca del Autor\u003c\/b\u003e\u003cbr\u003e\u003c\/p\u003e\u003cp\u003eJules S. Damji es un defensor senior de desarrolladores en Databricks y colaborador de MLflow. Es un desarrollador práctico con más de 20 años de experiencia y ha trabajado como ingeniero de software en empresas líderes como Sun Microsystems, Netscape, @Home, Loudcloud\/Opsware, Verisign, ProQuest y Hortonworks, construyendo sistemas distribuidos a gran escala. Posee una licenciatura y una maestría en ciencias de la computación y una maestría en defensa política y comunicación de la Universidad Estatal de Oregón, Cal State y la Universidad Johns Hopkins, respectivamente.\u003c\/p\u003e\u003cp\u003eBrooke Wenig es líder de práctica de aprendizaje automático en Databricks. Dirige un equipo de científicos de datos que desarrollan canalizaciones de aprendizaje automático a gran escala para clientes, además de impartir cursos sobre las mejores prácticas de aprendizaje automático distribuido. Anteriormente, fue consultora principal de ciencia de datos en Databricks. Posee una maestría en ciencias de la computación de UCLA con un enfoque en aprendizaje automático distribuido.\u003c\/p\u003e\u003cp\u003eTathagata Das es ingeniero de software en Databricks, un committer de Apache Spark y miembro del Comité de Gestión de Proyectos (PMC) de Apache Spark. Es uno de los desarrolladores originales de Apache Spark, el desarrollador principal de Spark Streaming (DStreams) y actualmente es uno de los desarrolladores principales de Structured Streaming y Delta Lake. Tathagata posee una maestría en ciencias de la computación de UC Berkeley.\u003c\/p\u003e\u003cp\u003eDenny Lee es un defensor de desarrolladores en Databricks que ha trabajado con Apache Spark desde la versión 0.6. Es un ingeniero práctico en sistemas distribuidos y ciencias de datos con amplia experiencia en el desarrollo de infraestructura a escala de Internet, plataformas de datos y sistemas de análisis predictivo tanto para entornos locales como en la nube. También tiene una maestría en informática biomédica de la Universidad de Salud y Ciencias de Oregón y ha diseñado e implementado potentes soluciones de datos para clientes de atención médica empresarial.\u003c\/p\u003e","brand":"O'Reilly Media","offers":[{"title":"Default Title","offer_id":42699638767853,"sku":"9781492050049","price":79.99,"currency_code":"USD","in_stock":true}],"thumbnail_url":"\/\/cdn.shopify.com\/s\/files\/1\/0550\/8097\/6621\/products\/img_8e90652e-0373-422e-85ae-4a0791ed3d1a.jpg?v=1649920950","url":"https:\/\/sureshotbooks.com\/es\/products\/learning-spark-lightning-fast-data-analytics-9781492050049","provider":"SureShot Books Publishing LLC","version":"1.0","type":"link"}