Descripción
Cree lagos de datos eficientes que puedan escalar a un tamaño prácticamente ilimitado usando AWS Glue
Características principales:
- Aprenda a trabajar con AWS Glue para superar los desafíos típicos de implementación en los lagos de datos.
- Cree y gestione pipelines ETL sin servidor que puedan escalar para gestionar big data.
- Escrita por miembros de la comunidad de AWS Glue, esta guía práctica le muestra cómo implementar AWS Glue en poco tiempo.
Descripción del libro:
Hoy en día, las organizaciones se han decantado por servicios como AWS Glue, que se encargan del trabajo pesado indiferenciado y proporcionan Spark sin servidor, lo que le permite crear y gestionar lagos de datos de forma sin servidor. Esta guía le muestra cómo se puede utilizar AWS Glue para resolver problemas del mundo real, además de ayudarle a aprender sobre el procesamiento de datos, la integración de datos y la construcción de lagos de datos.
Comenzando con los conceptos básicos de AWS Glue, este libro le enseña cómo realizar varios aspectos del análisis de datos, como consultas ad hoc, visualización de datos y análisis en tiempo real utilizando este servicio. También proporciona un recorrido por CI/CD para AWS Glue y cómo cambiar a la izquierda en la calidad utilizando pruebas de regresión automatizadas. Descubrirá cómo se implementan los aspectos de seguridad de los datos, como el control de acceso, el cifrado, la auditoría y la red, además de familiarizarse con técnicas útiles como la elección del formato de archivo correcto, la compresión, la partición y el bucketing. A medida que avance, descubrirá las características de AWS Glue, como rastreadores, Lake Formation, tablas gobernadas, linaje, DataBrew, Glue Studio y conectores personalizados. Los capítulos finales le ayudarán a comprender varias opciones de ajuste del rendimiento, solución de problemas y supervisión.
Al final de este libro de AWS, podrá crear, gestionar, solucionar problemas e implementar pipelines ETL utilizando AWS Glue.
Lo que aprenderá:
- Aplicar varias características de AWS Glue para gestionar y crear lagos de datos.
- Utilizar Glue DataBrew y Glue Studio para la preparación de datos.
- Optimizar el diseño de los datos en el almacenamiento en la nube para acelerar las cargas de trabajo analíticas.
- Gestionar metadatos, incluidas las definiciones de bases de datos, tablas y esquemas.
- Proteger sus datos durante el control de acceso, el cifrado, la auditoría y la red.
- Supervisar los trabajos de AWS Glue para detectar retrasos y pérdida de datos.
- Integrar Spark ML y SageMaker con AWS Glue para crear modelos de aprendizaje automático.
A quién va dirigido este libro:
Este libro está dirigido a desarrolladores ETL, ingenieros de datos y analistas de datos que quieran entender cómo AWS Glue puede ayudarles a resolver sus problemas de negocio. Se asume un conocimiento básico de los servicios de datos de AWS.
Autor: Vishal Pathak, Subramanya Vajiraya, Noritaka Sekiyama
Editorial: Packt Publishing
Publicado: 30/08/2022
Páginas: 434
Tipo de encuadernación: Tapa blanda
Peso: 1.63 libras
Tamaño: 9.25h x 7.50w x 0.88d
ISBN13: 9781800564985
ISBN10: 1800564988
Categorías BISAC:
- Informática | Ciencia de datos | Almacenamiento de datos
- Informática | Administración y gestión de bases de datos
Este título no es retornable

