Descripción
Migre de pandas y scikit-learn a PySpark para manejar grandes cantidades de datos y lograr un tiempo de procesamiento de datos más rápido. Este libro le mostrará cómo realizar esta transición adaptando sus habilidades y aprovechando las similitudes en la sintaxis, la funcionalidad y la interoperabilidad entre estas herramientas.
Distributed Machine Learning with PySpark ofrece una hoja de ruta para científicos de datos que consideran la transición de bibliotecas de datos pequeños (pandas/scikit-learn) al procesamiento de big data y al aprendizaje automático con PySpark. Aprenderá a traducir código Python de pandas/scikit-learn a PySpark para preprocesar grandes volúmenes de datos y construir, entrenar, probar y evaluar algoritmos populares de aprendizaje automático como regresión lineal y logística, árboles de decisión, bosques aleatorios, máquinas de vectores de soporte, Naïve Bayes y redes neuronales.
Después de completar este libro, comprenderá los conceptos fundamentales de preparación de datos y aprendizaje automático y tendrá las habilidades necesarias para aplicar estos métodos utilizando PySpark, el estándar de la industria para construir tuberías de datos de ML escalables.
Lo que aprenderá
- Dominar los fundamentos del aprendizaje supervisado, el aprendizaje no supervisado, el PNL y los sistemas de recomendación
- Comprender las diferencias entre PySpark, scikit-learn y pandas
- Realizar regresión lineal, regresión logística y regresión de árboles de decisión con pandas, scikit-learn y PySpark
- Distinguir entre las tuberías de PySpark y scikit-learn
A quién va dirigido este libro
Científicos de datos, ingenieros de datos y profesionales del aprendizaje automático que tienen cierta familiaridad con Python, pero que son nuevos en el aprendizaje automático distribuido y el marco PySpark.Autor: Abdelaziz Testas
Editorial: Apress
Publicado: 24/11/2023
Páginas: 490
Tipo de encuadernación: Tapa blanda
Peso: 1.94lbs
Tamaño: 10.00h x 7.00w x 1.03d
ISBN13: 9781484297506
ISBN10: 1484297504
Categorías BISAC:
- Informática | Inteligencia Artificial | General
- Informática | Lenguajes | Python

