Descripción
Comience a utilizar Apache Flink, el marco de código abierto que impulsa algunas de las aplicaciones de procesamiento de flujo de datos más grandes del mundo. Con este libro práctico, explorará los conceptos fundamentales del procesamiento de flujo de datos paralelo y descubrirá en qué se diferencia esta tecnología del procesamiento de datos por lotes tradicional.
Fabian Hueske y Vasia Kalavri, desarrolladores de Apache Flink desde hace mucho tiempo, le muestran cómo implementar aplicaciones de transmisión escalables con la API DataStream de Flink y cómo ejecutar y mantener continuamente estas aplicaciones en entornos operativos. El procesamiento de transmisiones es ideal para muchos casos de uso, incluidos ETL de baja latencia, análisis de transmisión y paneles de control en tiempo real, así como detección de fraudes, detección de anomalías y alertas. Puede procesar datos continuos de cualquier tipo, incluidas interacciones de usuarios, transacciones financieras y datos de IoT, tan pronto como los genere.
- Aprenda los conceptos y desafíos del procesamiento de flujo de datos distribuido con estado
- Explore la arquitectura del sistema de Flink, incluido su modo de procesamiento de tiempo de eventos y modelo de tolerancia a fallas
- Comprenda los fundamentos y los componentes básicos de la API de DataStream, incluidos sus operadores con estado y basados en el tiempo
- Lea datos desde y escriba datos a sistemas externos con consistencia exacta
- Implemente y configure clústeres de Flink
- Opere aplicaciones de transmisión en ejecución continua
Autor: Fabian Hueske, Vasiliki Kalavri
Editorial: O'Reilly Media
Publicado: 30/04/2019
Páginas: 310
Tipo de encuadernación: Tapa blanda
Peso: 1.00lbs
Tamaño: 9.10h x 7.00w x 0.60d
ISBN13: 9781491974292
ISBN10: 149197429X
Categorías BISAC:
- Informática | Ciencia de Datos | General
- Tecnología e Ingeniería | Sistemas de Transmisión de Datos | General
- Informática | Administración y Gestión de Bases de Datos
Sobre el autor
Fabian Hueske es un committer y miembro de la PMC del proyecto Apache Flink, y ha contribuido a Flink desde sus inicios. Fabian es cofundador, ingeniero de software y evangelista de la comunidad en data Artisans (ahora Ververica), una startup con sede en Berlín que fomenta Flink y su comunidad. Tiene un doctorado en ciencias de la computación de la TU Berlin.
Vasiliki (Vasia) Kalavri es investigadora postdoctoral en el Grupo de Sistemas de ETH Zúrich, donde utiliza Apache Flink extensivamente para la investigación y enseñanza de sistemas de transmisión. Vasia es miembro de la PMC del proyecto Apache Flink. Contribuyó desde el principio a Flink, trabajando en su biblioteca de procesamiento de gráficos, Gelly, y en versiones iniciales de la API de tablas y SQL de transmisión.

