Escalando Python con Dask: De la ciencia de datos al aprendizaje automático


Precio:
Precio de venta$79.99

Descripción

Los sistemas modernos contienen CPU y GPU multinúcleo que tienen el potencial de computación paralela. Pero muchas herramientas científicas de Python no fueron diseñadas para aprovechar este paralelismo. Con este recurso breve pero completo, los científicos de datos y los programadores de Python aprenderán cómo la biblioteca de código abierto Dask para computación paralela proporciona API que facilitan la paralelización de bibliotecas PyData, incluidas NumPy, pandas y scikit-learn.

Los autores Holden Karau y Mika Kimmins le muestran cómo usar los cálculos de Dask en sistemas locales y luego escalar a la nube para cargas de trabajo más pesadas. Este libro práctico explica por qué Dask es popular entre los expertos de la industria y los académicos, y es utilizado por organizaciones que incluyen Walmart, Capital One, Harvard Medical School y NASA.

Con este libro, aprenderá:

  • Qué es Dask, dónde puede usarlo y cómo se compara con otras herramientas
  • Cómo usar Dask para el procesamiento paralelo de datos por lotes
  • Conceptos clave de sistemas distribuidos para trabajar con Dask
  • Métodos para usar Dask con API y bloques de construcción de nivel superior
  • Cómo trabajar con bibliotecas integradas como scikit-learn, pandas y PyTorch
  • Cómo usar Dask con GPU


Autor: Holden Karau, Mika Kimmins
Editorial: O'Reilly Media
Publicado: 22/08/2023
Páginas: 223
Tipo de encuadernación: Tapa blanda
Peso: 0.81lbs
Tamaño: 9.19h x 7.00w x 0.48d
ISBN13: 9781098119874
ISBN10: 1098119878
Categorías BISAC:
- Informática | Ciencia de datos | Modelado y diseño de datos
- Informática | Programación | Código abierto
- Informática | Lenguajes | Python