Ingeniería de datos con Python: Trabaja con conjuntos de datos masivos para diseñar modelos de datos y automatizar tuberías de datos usando Python


Precio:
Precio de venta$69.32

Descripción

Cree, supervise y gestione flujos de datos en tiempo real para crear infraestructura de ingeniería de datos de manera eficiente utilizando proyectos de Apache de código abierto


Características clave:

  • Domine las arquitecturas de datos, la preparación de datos y las habilidades de optimización de datos con la ayuda de ejemplos prácticos
  • Diseñe modelos de datos y aprenda a extraer, transformar y cargar (ETL) datos usando Python
  • Programe, automatice y supervise flujos de datos complejos en producción


Descripción del libro

La ingeniería de datos proporciona la base para la ciencia de datos y el análisis, y constituye una parte importante de todas las empresas. Este libro le ayudará a explorar varias herramientas y métodos que se utilizan para comprender el proceso de ingeniería de datos utilizando Python.


El libro le mostrará cómo abordar los desafíos que se enfrentan comúnmente en diferentes aspectos de la ingeniería de datos. Comenzará con una introducción a los conceptos básicos de la ingeniería de datos, junto con las tecnologías y los marcos necesarios para construir flujos de datos para trabajar con grandes conjuntos de datos. Aprenderá a transformar y limpiar datos y a realizar análisis para sacar el máximo provecho de sus datos. A medida que avance, descubrirá cómo trabajar con grandes volúmenes de datos de complejidad variable y bases de datos de producción, y cómo construir flujos de datos. Utilizando ejemplos del mundo real, construirá arquitecturas sobre las que aprenderá a implementar flujos de datos.


Al final de este libro de Python, habrá adquirido una comprensión clara de las técnicas de modelado de datos y podrá construir con confianza flujos de ingeniería de datos para rastrear datos, ejecutar controles de calidad y realizar los cambios necesarios en producción.


Lo que aprenderá

  • Comprender cómo la ingeniería de datos apoya los flujos de trabajo de la ciencia de datos
  • Descubrir cómo extraer datos de archivos y bases de datos para luego limpiarlos, transformarlos y enriquecerlos
  • Configurar procesadores para manejar diferentes formatos de archivo, así como bases de datos relacionales y NoSQL
  • Aprender a implementar un flujo de datos y un panel de control para visualizar los resultados
  • Utilizar el almacenamiento provisional y la validación para verificar los datos antes de que lleguen al almacén
  • Construir flujos en tiempo real con áreas de almacenamiento provisional que realicen validación y manejen fallas
  • Dominar la implementación de flujos en el entorno de producción


A quién va dirigido este libro

Este libro está dirigido a analistas de datos, desarrolladores de ETL y cualquier persona que desee iniciarse o hacer la transición al campo de la ingeniería de datos o refrescar sus conocimientos de ingeniería de datos utilizando Python. Este libro también será útil para estudiantes que planean construir una carrera en ingeniería de datos o profesionales de TI que se preparan para una transición. No se requiere ningún conocimiento previo de ingeniería de datos.



Autor: Paul Crickard
Editorial: Packt Publishing
Publicado: 23/10/2020
Páginas: 356
Tipo de encuadernación: Tapa blanda
Peso: 1.35 libras
Tamaño: 9.25h x 7.50w x 0.74d
ISBN13: 9781839214189
ISBN10: 183921418X
Categorías BISAC:
- Informática | Ciencia de datos | Modelado y diseño de datos
- Informática | Ciencia de datos | Almacenamiento de datos

Este título no es retornable