Descripción
Domine las habilidades críticas necesarias para implementar y usar Databricks SQL y eleve su BI del almacén al lakehouse con confianza
Características clave:
- Aprenda sobre inteligencia empresarial en el lakehouse con las características y funciones de Databricks SQL
- Aproveche al máximo Databricks SQL familiarizándose con los facilitadores de sus capacidades de almacenamiento de datos
- Un enfoque único para enseñar conceptos y técnicas con escenarios de seguimiento en conjuntos de datos reales
Descripción del libro:
En esta nueva era del diseño de sistemas de plataformas de datos, los data lakes y los data warehouses están dando paso al lakehouse, un nuevo tipo de sistema de plataforma de datos que tiene como objetivo unificar todos los análisis de datos en una única plataforma. Databricks, con su suite de productos Databricks SQL, es la plataforma lakehouse más popular que existe, aprovechando el poder de Apache Spark(TM), Delta Lake y otras innovaciones para habilitar las capacidades de almacenamiento de datos en el lakehouse con la economía de un data lake.
Este libro es una guía práctica completa que lo ayudará a explorar todas las características avanzadas, casos de uso y componentes tecnológicos de Databricks SQL. Comenzará con los fundamentos de la arquitectura del lakehouse y comprenderá cómo encaja Databricks SQL en ella. Luego, el libro le mostrará cómo usar la plataforma, desde explorar datos, ejecutar consultas, construir informes y usar paneles hasta aprender los aspectos administrativos del lakehouse: seguridad de datos, gobernanza y administración del poder computacional del lakehouse. También profundizará en los habilitadores tecnológicos centrales de Databricks SQL: Delta Lake y Photon. Finalmente, pondrá en práctica comandos SQL avanzados para ingerir datos y mantener el lakehouse.
Al final de este libro, habrá dominado Databricks SQL y podrá implementar y ofrecer inteligencia empresarial rápida y escalable en el lakehouse.
Lo que aprenderá:
- Comprender cómo encaja Databricks SQL en la plataforma Databricks Lakehouse
- Realizar análisis diarios con Databricks SQL Workbench y herramientas de inteligencia empresarial
- Organizar y catalogar sus activos de datos
- Programar el modelo de seguridad de datos para proteger y gobernar sus datos
- Optimizar los almacenes SQL (clústeres informáticos) para una experiencia de consulta óptima
- Optimizar el formato de almacenamiento de Delta Lake para un máximo rendimiento de las consultas
- Ofrecer un rendimiento extremo con el motor de ejecución de consultas Photon
- Implementar patrones avanzados de ingesta de datos con Databricks SQL
Para quién es este libro:
Este libro es para profesionales de inteligencia empresarial, administradores de almacenes de datos e ingenieros de datos que son nuevos en Databricks SQL y quieren aprender a ofrecer información de alta calidad sin verse obstaculizados por la escala de los datos o la infraestructura. Este libro también es para cualquiera que busque estudiar las tecnologías avanzadas que impulsan Databricks SQL. Se recomienda un conocimiento básico de almacenes de datos, análisis basados en SQL y procesos ETL para aprender de manera efectiva los conceptos introducidos en este libro y apreciar la innovación detrás de la plataforma.
Autor: Vihag Gupta
Editorial: Packt Publishing
Publicado: 16/09/2022
Páginas: 348
Tipo de encuadernación: Tapa blanda
Peso: 1.32 libras
Tamaño: 9.25h x 7.50w x 0.72d
ISBN13: 9781803235332
ISBN10: 1803235330
Categorías BISAC:
- Computadoras | Ciencia de Datos | Visualización de Datos
- Computadoras | Inteligencia Artificial | General
- Computadoras | Idiomas | SQL
Este título no es retornable

