Descripción
El "data lakehouse" es la próxima generación del almacén de datos (data warehouse) y el lago de datos (data lake), diseñado para satisfacer los complejos y cambiantes sistemas de información modernos. Este libro le muestra cómo construir su "data lakehouse" como la base para sus iniciativas de inteligencia artificial (IA), aprendizaje automático (ML) y malla de datos. Conozca los obstáculos y las técnicas para maximizar el valor empresarial de su "data lakehouse".
Además, podrá explicar las características principales y los factores críticos de éxito de un "data lakehouse". Al revisar los errores de entrada, la incompatibilidad clave y garantizar una buena documentación, podemos mejorar la calidad y la credibilidad de los datos de su "lakehouse". Evalúe los criterios de calidad de los datos, incluyendo la precisión, la exhaustividad, la fiabilidad, la relevancia y la puntualidad. Comprenda los diferentes tipos de almacenamiento para el "lakehouse", incluido el almacenamiento masivo, infrautilizado pero extremadamente valioso.
Existen tres tipos de datos en el "data lakehouse" (estructurados, textuales y analógicos/IoT), y para cada uno, aprenda a construir una base sólida para la inteligencia artificial (IA), el aprendizaje automático (ML) y la malla de datos. Aproveche los modelos de datos para los datos estructurados, las ontologías y taxonomías para los datos textuales, y los algoritmos de destilación para los datos analógicos/IoT. Aprenda a abstraer estos tipos de datos para adaptarse a los requisitos futuros y simplificar el linaje de datos. Aplique Extract, Transform, and Load (ETL) para crear una estructura que devuelva las respuestas a los problemas empresariales. El resultado final es un "data lakehouse" que satisface nuestras necesidades.
Hablando de necesidades humanas, aprenda la Jerarquía de Necesidades de un "Data Lakehouse" de Maslow. A continuación, explore la integración de datos diseñada para IA, ML y malla de datos. Luego, profundice con nosotros en todas las variedades de análisis dentro del "lakehouse", incluyendo análisis estructurados, textuales y analógicos. Sea testigo de cómo los datos descriptivos, el catálogo de datos y los metadatos pueden aumentar el valor del "lakehouse".
Concluimos con una evolución detallada de la arquitectura de datos, desde la cinta magnética hasta el "data lakehouse" como base fundamental para la IA, el ML y la malla de datos.
Autor: Bill Inmon, Dave Rapien, Valerie Bartelt
Editorial: Technics Publications
Publicado: 01/06/2023
Páginas: 188
Tipo de encuadernación: Tapa blanda
Peso: 0.57lbs
Tamaño: 9.00h x 6.00w x 0.40d
ISBN13: 9781634621571
ISBN10: 1634621573
Categorías BISAC:
- Informática | Ciencia de datos | Almacenamiento de datos
- Informática | Software de negocios y productividad | Bases de datos
Este título no es retornable

