{"product_id":"data-analysis-with-python-and-pyspark-9781617297205","title":"Análisis de datos con Python y Pyspark","description":"\u003cb\u003e¡Piensa en grande con tus datos! PySpark lleva el potente motor de procesamiento de grandes volúmenes de datos de Spark al ecosistema de Python, permitiéndote escalar tus tareas de datos y crear pipelines ultrarrápidos.\u003c\/b\u003e \u003cp\u003e\u003c\/p\u003eEn \u003ci\u003eData Analysis with Python and PySpark\u003c\/i\u003e aprenderás a: \u003cp\u003e\u003c\/p\u003e Gestionar tus datos a medida que escalan a través de múltiples máquinas\u003cbr\u003e Escalar tus programas de datos con total confianza\u003cbr\u003e Leer y escribir datos desde y hacia una variedad de fuentes y formatos\u003cbr\u003e Lidiar con datos desordenados con la funcionalidad de manipulación de datos de PySpark\u003cbr\u003e Descubrir nuevos conjuntos de datos y realizar análisis de datos exploratorios\u003cbr\u003e Construir pipelines de datos automatizados que transforman, resumen y obtienen información de los datos\u003cbr\u003e Solucionar errores comunes de PySpark\u003cbr\u003e Crear trabajos fiables de larga duración \u003cp\u003e\u003c\/p\u003e \u003ci\u003eData Analysis with Python and PySpark\u003c\/i\u003e es tu guía para entregar proyectos de datos exitosos basados en Python. Repleto de ejemplos relevantes y técnicas esenciales, este libro práctico te enseña a construir pipelines para informes, aprendizaje automático y otras tareas centradas en datos. Los ejercicios rápidos en cada capítulo te ayudan a practicar lo que has aprendido y a comenzar a implementar PySpark en tus sistemas de datos rápidamente. No se requiere conocimiento previo de Spark. \u003cp\u003e\u003c\/p\u003e La compra del libro impreso incluye un eBook gratuito en formatos PDF, Kindle y ePub de Manning Publications. \u003cp\u003e\u003c\/p\u003e Sobre la tecnología\u003cbr\u003e El motor de procesamiento de datos Spark es una increíble fábrica de análisis: entran datos brutos, sale información. PySpark envuelve el motor central de Spark con una API basada en Python. Ayuda a simplificar la empinada curva de aprendizaje de Spark y pone esta potente herramienta a disposición de cualquiera que trabaje en el ecosistema de datos de Python. \u003cp\u003e\u003c\/p\u003e Sobre el libro\u003cbr\u003e \u003ci\u003eData Analysis with Python and PySpark\u003c\/i\u003e te ayuda a resolver los desafíos diarios de la ciencia de datos con PySpark. Aprenderás a escalar tus capacidades de procesamiento a través de múltiples máquinas mientras ingieres datos desde cualquier fuente, ya sean clústeres de Hadoop, almacenamiento de datos en la nube o archivos de datos locales. Una vez que hayas cubierto los fundamentos, explorarás la versatilidad completa de PySpark construyendo pipelines de aprendizaje automático y combinando código de Python, pandas y PySpark. \u003cp\u003e\u003c\/p\u003e Qué hay dentro \u003cp\u003e\u003c\/p\u003e Organizar tu código PySpark\u003cbr\u003e Gestionar tus datos, sin importar el tamaño\u003cbr\u003e Escalar tus programas de datos con total confianza\u003cbr\u003e Solucionar problemas comunes de pipelines de datos\u003cbr\u003e Crear trabajos fiables de larga duración \u003cp\u003e\u003c\/p\u003eSobre el lector\u003cbr\u003e Escrito para científicos e ingenieros de datos familiarizados con Python. \u003cp\u003e\u003c\/p\u003e Sobre el autor\u003cbr\u003e Como director de ML para una empresa de software basada en datos, \u003cb\u003eJonathan Rioux\u003c\/b\u003e utiliza PySpark a diario. Enseña el software a científicos de datos, ingenieros y analistas de negocios expertos en datos. \u003cp\u003e\u003c\/p\u003eTabla de contenido \u003cp\u003e\u003c\/p\u003e1 Introducción\u003cbr\u003e PARTE 1 FAMILIARÍZATE: PRIMEROS PASOS EN PYSPARK\u003cbr\u003e 2 Tu primer programa de datos en PySpark\u003cbr\u003e 3 Enviando y escalando tu primer programa PySpark\u003cbr\u003e 4 Analizando datos tabulares con pyspark.sql\u003cbr\u003e 5 Gimnasia con dataframes: Uniendo y agrupando\u003cbr\u003e PARTE 2 ADQUIERE DESTREZA: TRADUCE TUS IDEAS EN CÓDIGO\u003cbr\u003e 6 Dataframes multidimensionales: Usando PySpark con datos JSON\u003cbr\u003e 7 PySpark bilingüe: Combinando código Python y SQL\u003cbr\u003e 8 Extendiendo PySpark con Python: RDD y UDFs\u003cbr\u003e 9 Los grandes datos son solo muchos datos pequeños: Usando pandas UDFs\u003cbr\u003e 10 Tus datos bajo una lente diferente: Funciones de ventana\u003cbr\u003e 11 PySpark más rápido: Entendiendo la planificación de consultas de Spark\u003cbr\u003e PARTE 3 GANA CONFIANZA: USANDO APRENDIZAJE AUTOMÁTICO CON PYSPARK\u003cbr\u003e 12 Preparando el escenario: Preparando características para el aprendizaje automático\u003cbr\u003e 13 Aprendizaje automático robusto con ML Pipelines\u003cbr\u003e 14 Construyendo transformadores y estimadores de ML personalizados\u003cbr\u003e\u003cbr\u003e\u003cb\u003eAutor:\u003c\/b\u003e \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=AUTH-14602199\"\u003eJonathan Rioux\u003c\/a\u003e\u003cbr\u003e\u003cb\u003eEditorial:\u003c\/b\u003e Manning Publications\u003cbr\u003e\u003cb\u003ePublicado:\u003c\/b\u003e 22\/03\/2022\u003cbr\u003e\u003cb\u003ePáginas:\u003c\/b\u003e 456\u003cbr\u003e\u003cb\u003eTipo de encuadernación:\u003c\/b\u003e Tapa blanda\u003cbr\u003e\u003cb\u003ePeso:\u003c\/b\u003e 1.67 libras\u003cbr\u003e\u003cb\u003eTamaño:\u003c\/b\u003e 9.13h x 7.32w x 1.10d\u003cbr\u003e\u003cb\u003eISBN13:\u003c\/b\u003e 9781617297205\u003cbr\u003e\u003cb\u003eISBN10:\u003c\/b\u003e 1617297208\u003cbr\u003e\u003cb\u003eCategorías BISAC:\u003c\/b\u003e\u003cbr\u003e- \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=CAT-COM\"\u003eInformática\u003c\/a\u003e | \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=BISAC-COM021030\"\u003eCiencia de Datos | Análisis de Datos\u003c\/a\u003e\u003cbr\u003e- \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=CAT-COM\"\u003eInformática\u003c\/a\u003e | \u003ca href=\"https:\/\/sureshotbooks-com.myshopify.com\/search?type=product%2Carticle%2Cpage\u0026amp;q=BISAC-COM051360\"\u003eLenguajes | Python\u003c\/a\u003e\u003cbr\u003e\u003cbr\u003e\u003cp\u003e\u003cb\u003eAcerca del autor\u003c\/b\u003e\u003cbr\u003eComo científico de datos para una consultoría de ingeniería, \u003cb\u003eJonathan Rioux\u003c\/b\u003e utiliza PySpark a diario. Enseña el software a científicos de datos, ingenieros y analistas de negocios con conocimientos de datos.\u003c\/p\u003e","brand":"Manning Publications","offers":[{"title":"Default Title","offer_id":42684860006637,"sku":"9781617297205","price":79.98,"currency_code":"USD","in_stock":false}],"thumbnail_url":"\/\/cdn.shopify.com\/s\/files\/1\/0550\/8097\/6621\/products\/img_47cf9bb6-866f-4d1d-8d7e-bf4cbcafdad7.jpg?v=1649759721","url":"https:\/\/sureshotbooks.com\/es\/products\/data-analysis-with-python-and-pyspark-9781617297205","provider":"SureShot Books Publishing LLC","version":"1.0","type":"link"}