Name: Ingeniería de datos con Python: Trabaja con conjuntos de datos masivos para diseñar modelos de datos y automatizar tuberías de datos usando Python
SKU: 9781839214189
Price: 69.32 USD
Availability: InStock

Data Engineering with Python: Work with massive datasets to design data models and automate data pipelines using Python Paperback Packt Publishing

Pasa el cursor sobre la imagen para ampliarla. Clic en la imagen para aumentar

Cree, supervise y gestione flujos de datos en tiempo real para crear infraestructura de ingeniería de datos de manera eficiente utilizando proyectos de Apache de código abierto

Características clave:

Domine las arquitecturas de datos, la preparación de datos y las habilidades de optimización de datos con la ayuda de ejemplos prácticos
Diseñe modelos de datos y aprenda a extraer, transformar y cargar (ETL) datos usando Python
Programe, automatice y supervise flujos de datos complejos en producción

Descripción del libro

La ingeniería de datos proporciona la base para la ciencia de datos y el análisis, y constituye una parte importante de todas las empresas. Este libro le ayudará a explorar varias herramientas y métodos que se utilizan para comprender el proceso de ingeniería de datos utilizando Python.

El libro le mostrará cómo abordar los desafíos que se enfrentan comúnmente en diferentes aspectos de la ingeniería de datos. Comenzará con una introducción a los conceptos básicos de la ingeniería de datos, junto con las tecnologías y los marcos necesarios para construir flujos de datos para trabajar con grandes conjuntos de datos. Aprenderá a transformar y limpiar datos y a realizar análisis para sacar el máximo provecho de sus datos. A medida que avance, descubrirá cómo trabajar con grandes volúmenes de datos de complejidad variable y bases de datos de producción, y cómo construir flujos de datos. Utilizando ejemplos del mundo real, construirá arquitecturas sobre las que aprenderá a implementar flujos de datos.

Al final de este libro de Python, habrá adquirido una comprensión clara de las técnicas de modelado de datos y podrá construir con confianza flujos de ingeniería de datos para rastrear datos, ejecutar controles de calidad y realizar los cambios necesarios en producción.

Lo que aprenderá

Comprender cómo la ingeniería de datos apoya los flujos de trabajo de la ciencia de datos
Descubrir cómo extraer datos de archivos y bases de datos para luego limpiarlos, transformarlos y enriquecerlos
Configurar procesadores para manejar diferentes formatos de archivo, así como bases de datos relacionales y NoSQL
Aprender a implementar un flujo de datos y un panel de control para visualizar los resultados
Utilizar el almacenamiento provisional y la validación para verificar los datos antes de que lleguen al almacén
Construir flujos en tiempo real con áreas de almacenamiento provisional que realicen validación y manejen fallas
Dominar la implementación de flujos en el entorno de producción

A quién va dirigido este libro

Este libro está dirigido a analistas de datos, desarrolladores de ETL y cualquier persona que desee iniciarse o hacer la transición al campo de la ingeniería de datos o refrescar sus conocimientos de ingeniería de datos utilizando Python. Este libro también será útil para estudiantes que planean construir una carrera en ingeniería de datos o profesionales de TI que se preparan para una transición. No se requiere ningún conocimiento previo de ingeniería de datos.

Autor: Paul Crickard
Editorial: Packt Publishing
Publicado: 23/10/2020
Páginas: 356
Tipo de encuadernación: Tapa blanda
Peso: 1.35 libras
Tamaño: 9.25h x 7.50w x 0.74d
ISBN13: 9781839214189
ISBN10: 183921418X
Categorías BISAC:
- Informática | Ciencia de datos | Modelado y diseño de datos
- Informática | Ciencia de datos | Almacenamiento de datos

Este título no es retornable