Construcción de pipelines ETL con Python: Cree e implemente pipelines ETL listos para la empresa empleando métodos modernos


Precio:
Precio de venta$49.32

Descripción

Desarrolle pipelines ETL listos para producción aprovechando las bibliotecas de Python y desplegándolos para casos de uso adecuados


Características principales:


  • Comprender cómo configurar un entorno virtual de Python con PyCharm
  • Aprender enfoques funcionales y orientados a objetos para crear pipelines ETL
  • Crear procesos robustos de CI/CD para pipelines ETL
  • La compra del libro impreso o Kindle incluye un libro electrónico en PDF gratuito


Descripción del libro:


Los modernos pipelines de extracción, transformación y carga (ETL) para ingeniería de datos han favorecido el lenguaje Python por su amplia gama de usos y su gran variedad de herramientas, aplicaciones y componentes de código abierto. Con su simplicidad y amplio soporte de bibliotecas, Python se ha convertido en la elección indiscutible para el procesamiento de datos.


En este libro, recorrerá el proceso de principio a fin del desarrollo de pipelines de datos ETL, comenzando con una introducción a los fundamentos de los pipelines de datos y el establecimiento de un entorno de desarrollo de Python para crear pipelines. Una vez que haya explorado los principios de diseño de pipelines ETL y el proceso de desarrollo de ET, estará equipado para diseñar pipelines ETL personalizados. A continuación, comprenderá los pasos del proceso ETL, que implica extraer datos valiosos; realizar transformaciones, mediante la limpieza, manipulación y aseguramiento de la integridad de los datos; y finalmente cargar los datos procesados en sistemas de almacenamiento. También revisará varios módulos ETL en Python, comparando sus pros y sus contras al construir pipelines de datos y aprovechando herramientas en la nube, como AWS, para crear pipelines de datos escalables. Por último, aprenderá sobre el concepto de desarrollo basado en pruebas para pipelines ETL para garantizar implementaciones seguras.


Al final de este libro, habrá trabajado en varios ejemplos prácticos para crear pipelines ETL de alto rendimiento para desarrollar entornos robustos, escalables y resilientes utilizando Python.


Lo que aprenderá:


  • Explorar las bibliotecas y herramientas disponibles para crear pipelines ETL usando Python
  • Escribir código ETL limpio y resiliente en Python que pueda ser extendido y escalado fácilmente
  • Comprender las mejores prácticas y principios de diseño para crear pipelines ETL
  • Orquestar el proceso ETL y escalar el pipeline ETL de manera efectiva
  • Descubrir herramientas y servicios disponibles en AWS para pipelines ETL
  • Comprender diferentes estrategias de prueba e implementarlas con el proceso ETL


A quién va dirigido este libro:


Si usted es un ingeniero de datos o un profesional del software que busca crear pipelines ETL a nivel empresarial utilizando Python, este libro es para usted. El conocimiento fundamental de Python es un requisito previo.

Autor: Brij Kishore Pandey, Emily Ro Schoof
Editorial: Packt Publishing
Publicado: 29/09/2023
Páginas: 246
Tipo de encuadernación: Tapa blanda
Peso: 0.95lbs
Tamaño: 9.25h x 7.50w x 0.52d
ISBN13: 9781804615256
ISBN10: 1804615250
Categorías BISAC:
- Informática | Administración y gestión de bases de datos
- Informática | Ciencia de datos | Análisis de datos

Este título no es retornable