Ingeniería de datos con AWS: Aprenda a diseñar y construir pipelines de transformación de datos basados en la nube usando AWS


Precio:
Precio de venta$90.65

Descripción

El manual experto que faltaba para el ecosistema AWS: pase de los fundamentos a la creación de tuberías de ingeniería de datos sin esfuerzo

La compra del libro impreso o Kindle incluye un libro electrónico gratuito en formato PDF.


Características clave:

  • Aprenda sobre arquitecturas de datos comunes y enfoques modernos para generar valor a partir de grandes volúmenes de datos.
  • Explore las herramientas de AWS para la ingesta, transformación y consumo de datos, y para la orquestación de tuberías.
  • Aprenda a diseñar e implementar lagos de datos y "data lakehouses" para el análisis de grandes volúmenes de datos.

Descripción del libro:

Saber cómo diseñar e implementar complejos pipelines de datos es una habilidad muy solicitada. Los ingenieros de datos son responsables de construir estos pipelines que ingieren, transforman y unen conjuntos de datos brutos, creando nuevo valor a partir de los datos en el proceso.

Amazon Web Services (AWS) ofrece una gama de herramientas para simplificar el trabajo de un ingeniero de datos, lo que la convierte en la plataforma preferida para realizar tareas de ingeniería de datos.

Este libro le guiará a través de los servicios y las habilidades que necesita para diseñar e implementar pipelines de datos en AWS. Comenzará revisando importantes conceptos de ingeniería de datos y algunos de los servicios centrales de AWS que forman parte del conjunto de herramientas del ingeniero de datos. Luego, diseñará un pipeline de datos, revisará las fuentes de datos sin procesar, transformará los datos y aprenderá cómo los datos transformados son utilizados por varios consumidores de datos. El libro también le enseñará cómo poblar mercados de datos y almacenes de datos, junto con cómo encaja un "data lakehouse" en la imagen. Más adelante, se le presentarán las herramientas de AWS para analizar datos, incluidas las para consultas SQL ad-hoc y la creación de visualizaciones. En los capítulos finales, comprenderá cómo se puede utilizar el poder del aprendizaje automático y la inteligencia artificial para extraer nuevas perspectivas de los datos.

Al final de este libro de AWS, podrá llevar a cabo tareas de ingeniería de datos e implementar un pipeline de datos en AWS de forma independiente.


Lo que aprenderá:

  • Comprender los conceptos de ingeniería de datos y las tecnologías emergentes.
  • Ingerir datos de streaming con Amazon Kinesis Data Firehose.
  • Optimizar, desnormalizar y unir conjuntos de datos con AWS Glue Studio.
  • Usar eventos de Amazon S3 para activar un proceso Lambda para transformar un archivo.
  • Ejecutar consultas SQL complejas en datos de data lake usando Amazon Athena.
  • Cargar datos en un almacén de datos Redshift y ejecutar consultas.
  • Crear una visualización de sus datos usando Amazon QuickSight.
  • Extraer datos de sentimiento de un conjunto de datos usando Amazon Comprehend.


Para quién es este libro:

Este libro es para ingenieros de datos, analistas de datos y arquitectos de datos que son nuevos en AWS y buscan ampliar sus habilidades a la nube de AWS. También será útil para cualquier persona que sea nueva en la ingeniería de datos y quiera aprender sobre los conceptos fundamentales mientras adquiere experiencia práctica con los servicios comunes de ingeniería de datos en AWS.

Una comprensión básica de temas relacionados con big data y codificación en Python le ayudará a aprovechar al máximo este libro, pero no es necesario. La familiaridad con la consola de AWS y los servicios principales también es útil, pero no imprescindible.



Autor: Gareth Eagar
Editorial: Packt Publishing
Publicado: 29/12/2021
Páginas: 482
Tipo de encuadernación: Tapa blanda
Peso: 1.81 libras
Tamaño: 9.25h x 7.50w x 0.97d
ISBN13: 9781800560413
ISBN10: 1800560419
Categorías BISAC:
- Informática | Ciencia de Datos | Modelado y Diseño de Datos

Este título no es retornable