Descripción
Análisis de Big Data con Spark es una guía paso a paso para aprender Spark, que es un framework de computación en clúster de código abierto, rápido y de propósito general para el análisis de datos a gran escala. Aprenderá a usar Spark para diferentes tipos de proyectos de análisis de big data, incluidos el análisis de datos por lotes, interactivos, gráficos y de flujo, así como el aprendizaje automático. Además, este libro le ayudará a convertirse en un experto en Spark muy solicitado.
Spark es una de las tecnologías más populares de Big Data. La cantidad de datos generados hoy en día por dispositivos, aplicaciones y usuarios está explotando. Por lo tanto, existe una necesidad crítica de herramientas que puedan analizar datos a gran escala y desbloquear su valor. Spark es una tecnología potente que satisface esa necesidad. Puede, por ejemplo, usar Spark para realizar cálculos de baja latencia mediante el uso de almacenamiento en caché eficiente y algoritmos iterativos; aprovechar las características de su shell para un análisis de datos fácil e interactivo; emplear su procesamiento por lotes rápido y sus características de baja latencia para procesar sus flujos de datos en tiempo real, y así sucesivamente. Como resultado, la adopción de Spark está creciendo rápidamente y está reemplazando a Hadoop MapReduce como la tecnología preferida para el análisis de big data.
Este libro proporciona una introducción a Spark y las tecnologías de big data relacionadas. Cubre el núcleo de Spark y sus bibliotecas complementarias, incluidas Spark SQL, Spark Streaming, GraphX y MLlib. Análisis de Big Data con Spark está, por lo tanto, escrito para profesionales ocupados que prefieren aprender una nueva tecnología de una fuente consolidada en lugar de pasar innumerables horas en Internet tratando de recopilar fragmentos de diferentes fuentes.
El libro también incluye un capítulo sobre Scala, el lenguaje de programación funcional más popular, y el programa que subyace a Spark. Aprenderá los conceptos básicos de la programación funcional en Scala para que pueda escribir aplicaciones de Spark en él.Además, Análisis de Big Data con Spark ofrece una introducción a otras tecnologías de big data que se utilizan comúnmente junto con Spark, como Hive, Avro, Kafka, etc. Así que el libro es autosuficiente; se cubren todas las tecnologías que necesita saber para usar Spark. Lo único que se espera que sepa es programar en cualquier lenguaje.
Existe una escasez crítica de personas con experiencia en big data, por lo que las empresas están dispuestas a pagar mucho por personas con habilidades en áreas como Spark y Scala. Por lo tanto, leer este libro y absorber sus principios le dará un impulso, posiblemente un gran impulso, a su carrera.Autor: Mohammed Guller
Editorial: Apress
Publicado: 25/12/2015
Páginas: 277
Tipo de encuadernación: Tapa blanda
Peso: 1,17 libras
Tamaño: 10,00h x 7,00w x 0,64d
ISBN13: 9781484209653
ISBN10: 1484209656
Categorías BISAC:
- Informática | Ciencia de datos | General
- Informática | Administración y gestión de bases de datos
Sobre el autor
Mohammed Guller es el arquitecto principal en Glassbeam, donde dirige el desarrollo de productos de análisis avanzados y predictivos. Es un experto en big data y Spark. Es invitado con frecuencia a hablar en conferencias relacionadas con big data. Le apasiona la creación de nuevos productos, el análisis de big data y el aprendizaje automático.
Mohammed tiene un máster en administración de empresas de la Universidad de California, Berkeley, y un máster en aplicaciones informáticas de RCC, Universidad de Gujarat, India.

