Descripción
Renueve su panorama de datos e implemente pipelines de datos altamente efectivos en AWS con esta guía práctica
La compra del libro impreso o Kindle incluye un eBook PDF gratuito
Características clave:
- Ejecute tareas de extracción, transformación y carga (ETL) en lagos de datos, almacenes de datos y bases de datos.
- Implemente operaciones de datos efectivas con Pandas y data wrangler
- Integre pipelines con servicios de datos de AWS
Descripción del libro:
La preparación de datos (data wrangling) es el proceso de limpiar, transformar y organizar datos brutos, desordenados o no estructurados en un formato estructurado. Implica procesos como la limpieza de datos, la integración de datos, la transformación de datos y el enriquecimiento de datos para garantizar que los datos sean precisos, consistentes y adecuados para el análisis. "Data Wrangling on AWS" le proporciona los conocimientos necesarios para aprovechar todo el potencial de las herramientas de preparación de datos de AWS.
En primer lugar, se le presentará la preparación de datos en AWS y se familiarizará con los servicios de preparación de datos disponibles en AWS. Comprenderá cómo trabajar con AWS Glue DataBrew, AWS data wrangler y AWS Sagemaker. A continuación, descubrirá otros servicios de AWS como Amazon S3, Redshift, Athena y Quicksight. Además, explorará temas avanzados como la realización de operaciones de datos Pandas con AWS data wrangler, la optimización de datos ML con AWS SageMaker, la creación del almacén de datos con Glue DataBrew, junto con aspectos de seguridad y monitoreo.
Al final de este libro, estará bien equipado para realizar la preparación de datos utilizando los servicios de AWS.
Lo que aprenderá:
- Explore cómo escribir transformaciones simples a complejas usando AWS data wrangler
- Utilice funciones abstractas para extraer y cargar datos desde y hacia los almacenes de datos de AWS.
- Configure AWS Glue DataBrew para la preparación de datos
- Desarrolle pipelines de datos usando AWS data wrangler
- Integre las características de seguridad de AWS en Data Wrangler usando la gestión de identidad y acceso (IAM)
- Optimice sus datos con AWS SageMaker
A quién va dirigido este libro:
Este libro está dirigido a ingenieros de datos, científicos de datos y analistas de datos de negocios que buscan explorar las capacidades, herramientas y servicios de preparación de datos en AWS para sus tareas de ETL. Se requiere un conocimiento básico de Python, Pandas y familiaridad con herramientas de AWS como AWS Glue, Amazon Athena para aprovechar al máximo este libro.
Autor: Navnit Shukla, Sankar M, Sam Palani
Editorial: Packt Publishing
Publicado: 31/07/2023
Páginas: 420
Tipo de encuadernación: Tapa blanda
Peso: 1.58 libras
Tamaño: 9.25h x 7.50w x 0.86d
ISBN13: 9781801810906
ISBN10: 1801810907
Categorías BISAC:
- Computadoras | Ciencia de Datos | Modelado y Diseño de Datos
Este título no es retornable

