Aprendizaje automático distribuido con PySpark: migrando sin esfuerzo desde Pandas y Scikit-Learn


Precio:
Precio de venta$49.99

Descripción

Migre de pandas y scikit-learn a PySpark para manejar grandes cantidades de datos y lograr un tiempo de procesamiento de datos más rápido. Este libro le mostrará cómo realizar esta transición adaptando sus habilidades y aprovechando las similitudes en la sintaxis, la funcionalidad y la interoperabilidad entre estas herramientas.

Distributed Machine Learning with PySpark ofrece una hoja de ruta para científicos de datos que consideran la transición de bibliotecas de datos pequeños (pandas/scikit-learn) al procesamiento de big data y al aprendizaje automático con PySpark. Aprenderá a traducir código Python de pandas/scikit-learn a PySpark para preprocesar grandes volúmenes de datos y construir, entrenar, probar y evaluar algoritmos populares de aprendizaje automático como regresión lineal y logística, árboles de decisión, bosques aleatorios, máquinas de vectores de soporte, Naïve Bayes y redes neuronales.

Después de completar este libro, comprenderá los conceptos fundamentales de preparación de datos y aprendizaje automático y tendrá las habilidades necesarias para aplicar estos métodos utilizando PySpark, el estándar de la industria para construir tuberías de datos de ML escalables.

Lo que aprenderá

  • Dominar los fundamentos del aprendizaje supervisado, el aprendizaje no supervisado, el PNL y los sistemas de recomendación
  • Comprender las diferencias entre PySpark, scikit-learn y pandas
  • Realizar regresión lineal, regresión logística y regresión de árboles de decisión con pandas, scikit-learn y PySpark
  • Distinguir entre las tuberías de PySpark y scikit-learn

A quién va dirigido este libro

Científicos de datos, ingenieros de datos y profesionales del aprendizaje automático que tienen cierta familiaridad con Python, pero que son nuevos en el aprendizaje automático distribuido y el marco PySpark.

Autor: Abdelaziz Testas
Editorial: Apress
Publicado: 24/11/2023
Páginas: 490
Tipo de encuadernación: Tapa blanda
Peso: 1.94lbs
Tamaño: 10.00h x 7.00w x 1.03d
ISBN13: 9781484297506
ISBN10: 1484297504
Categorías BISAC:
- Informática | Inteligencia Artificial | General
- Informática | Lenguajes | Python