Ingeniería de datos con Google Cloud Platform: Una guía práctica para la operacionalización de sistemas escalables de análisis de datos en GCP


Precio:
Precio de venta$97.32

Descripción

Cree e implemente sus propias canalizaciones de datos en GCP, tome decisiones arquitectónicas clave y obtenga la confianza para impulsar su carrera como ingeniero de datos.


Características clave:

Comprenda los conceptos de ingeniería de datos, el rol de un ingeniero de datos y los beneficios de usar GCP para construir su solución.

Aprenda a utilizar los diversos productos de GCP para ingerir, consumir y transformar datos, y orquestar canalizaciones.

Descubra consejos para prepararse y aprobar el examen de Ingeniero de Datos Profesional.


Descripción del libro:

Con este libro, comprenderá cómo la altamente escalable Google Cloud Platform (GCP) permite a los ingenieros de datos crear canalizaciones de datos de extremo a extremo, desde el almacenamiento y procesamiento de datos y la orquestación del flujo de trabajo hasta la presentación de datos a través de paneles de visualización.

Comenzando con una rápida visión general de los conceptos fundamentales de la ingeniería de datos, aprenderá las diversas responsabilidades de un ingeniero de datos y cómo GCP juega un papel vital en el cumplimiento de esas responsabilidades. A medida que avance en los capítulos, podrá aprovechar los productos de GCP para construir un almacén de datos de muestra utilizando Cloud Storage y BigQuery, y un lago de datos utilizando Dataproc. El libro lo guiará gradualmente a través de operaciones como la ingesta de datos, la limpieza de datos, la transformación y la integración de datos con otras fuentes. Aprenderá cómo diseñar IAM para la gobernanza de datos, implementar canalizaciones de ML con Vertex AI, aprovechar los modelos de GCP preconstruidos como servicio y visualizar datos con Google Data Studio para construir informes convincentes. Finalmente, encontrará consejos sobre cómo impulsar su carrera como ingeniero de datos, realizar el examen de certificación de Ingeniero de Datos Profesional y prepararse para convertirse en un experto en ingeniería de datos con GCP.

Al final de este libro de ingeniería de datos, habrá desarrollado las habilidades para realizar tareas centrales de ingeniería de datos y construir eficientes canalizaciones de datos ETL con GCP.


Lo que aprenderá:

Cargar datos en BigQuery y materializar su salida para el consumo posterior.

Construir orquestación de canalizaciones de datos utilizando Cloud Composer.

Desarrollar trabajos de Airflow para orquestar y automatizar un almacén de datos.

Construir un lago de datos Hadoop, crear clústeres efímeros y ejecutar trabajos en el clúster de Dataproc.

Aprovechar Pub/Sub para mensajería e ingesta para sistemas basados en eventos.

Usar Dataflow para realizar ETL en datos de transmisión.

Desbloquear el poder de sus datos con Data Studio.

Calcular la estimación de costos de GCP para sus soluciones de datos de extremo a extremo.


Para quién es este libro:

Este libro es para ingenieros de datos, analistas de datos y cualquier persona que busque diseñar y administrar canalizaciones de procesamiento de datos utilizando GCP. Este libro le resultará útil si se está preparando para realizar el examen de Ingeniero de Datos Profesional de Google. Es necesario un conocimiento de nivel principiante de ciencia de datos, el lenguaje de programación Python y los comandos de Linux. Una comprensión básica del procesamiento de datos y la computación en la nube, en general, le ayudará a aprovechar al máximo este libro.

Autor: Adi Wijaya
Editorial: Packt Publishing
Publicado: 31/03/2022
Páginas: 440
Tipo de encuadernación: Tapa blanda
Peso: 1.66 libras
Tamaño: 9.25 alto x 7.50 ancho x 0.89 profundo
ISBN13: 9781800561328
ISBN10: 1800561326
Categorías BISAC:
- Informática | Ciencia de datos | Modelado y diseño de datos

Este título no es retornable