Descripción
Resuelva problemas de datos del mundo real y cree flujos de trabajo basados en datos para un fácil movimiento y procesamiento de datos a escala con Azure Data Factory
Características clave
- Aprenda a cargar y transformar datos de varias fuentes, tanto locales como en la nube.
- Utilice el entorno visual de Azure Data Factory para construir y gestionar tuberías ETL híbridas.
- Descubra cómo preparar, transformar, procesar y enriquecer datos para generar información clave.
Descripción del libro
Azure Data Factory (ADF) es una herramienta moderna de integración de datos disponible en Microsoft Azure. Este libro de recetas de Azure Data Factory le ayuda a empezar mostrándole cómo crear y ejecutar su primer trabajo en ADF. Aprenderá a ramificar y encadenar actividades, crear actividades personalizadas y programar tuberías. Este libro le ayudará a descubrir los beneficios del almacenamiento de datos en la nube, Azure Synapse Analytics y Azure Data Lake Gen2 Storage, que se utilizan con frecuencia para el análisis de grandes volúmenes de datos. Con recetas prácticas, aprenderá a interactuar activamente con las herramientas analíticas de Azure Data Services y a aprovechar su infraestructura local con herramientas nativas de la nube para obtener información empresarial relevante. A medida que avance, podrá integrar los servicios de Azure más utilizados en ADF y comprender cómo los servicios de Azure pueden ser útiles en el diseño de tuberías ETL. El libro le guiará a través de los errores comunes que puede encontrar al trabajar con ADF y le mostrará cómo usar el portal de Azure para monitorear las tuberías. También comprenderá los mensajes de error y resolverá problemas en conectores y flujos de datos con las capacidades de depuración de ADF.
Al final de este libro, podrá usar ADF como la principal herramienta ETL y de orquestación para sus proyectos de almacenamiento de datos o plataforma de datos.
Lo que aprenderá
- Crear un trabajo de orquestación y transformación en ADF
- Desarrollar, ejecutar y monitorear flujos de datos usando Azure Synapse
- Crear tuberías de big data usando Azure Data Lake y ADF
- Construir una aplicación de aprendizaje automático con Apache Spark y ADF
- Migrar trabajos SSIS locales a ADF
- Integrar ADF con servicios de Azure comúnmente usados como Azure ML, Azure Logic Apps y Azure Functions
- Ejecutar trabajos de computación de big data dentro de HDInsight y Azure Databricks
- Copiar datos de AWS S3 y Google Cloud Storage a Azure Storage usando los conectores integrados de ADF
A quién va dirigido este libro
Este libro está dirigido a desarrolladores ETL, arquitectos de almacenamiento de datos y ETL, profesionales de software y a cualquiera que desee aprender sobre los desafíos comunes y no tan comunes que se enfrentan al desarrollar soluciones ETL tradicionales e híbridas utilizando Azure Data Factory de Microsoft. También le resultará útil si busca recetas para mejorar o potenciar sus pipelines ETL existentes. Se espera un conocimiento básico de almacenamiento de datos.
Autor: Dmitry Anoshin, Dmitry Foshin, Roman Storchak
Editorial: Packt Publishing
Publicado: 24/12/2020
Páginas: 382
Tipo de encuadernación: Tapa blanda
Peso: 1.44lbs
Tamaño: 9.25h x 7.50w x 0.79d
ISBN13: 9781800565296
ISBN10: 1800565291
Categorías BISAC:
- Informática | Ciencia de datos | Almacenamiento de datos
- Informática | Ciencia de datos | Modelado y diseño de datos
Este título no es retornable

