Preentrenar modelos de visión y lenguaje grandes en Python: técnicas de extremo a extremo para construir e implementar modelos de base en AWS


Precio:
Precio de venta$69.32

Descripción

Domine el arte de entrenar modelos de visión y de lenguaje de gran tamaño con fundamentos conceptuales y la guía de expertos de la industria. Aprenda sobre los servicios y patrones de diseño de AWS, con ejemplos de codificación relevantes.


Características principales:

  • Aprenda a desarrollar, entrenar, ajustar y aplicar modelos fundacionales con flujos de trabajo optimizados de extremo a extremo.
  • Explore el entrenamiento distribuido a gran escala para modelos y conjuntos de datos con ejemplos de AWS y SageMaker.
  • Evalúe, despliegue y ponga en funcionamiento sus modelos personalizados con detección de sesgos y monitoreo de flujo de trabajo.


Descripción del libro:

Los modelos fundacionales han cambiado para siempre el aprendizaje automático. Desde BERT hasta ChatGPT, CLIP y Stable Diffusion, cuando miles de millones de parámetros se combinan con grandes conjuntos de datos y cientos o miles de GPU, el resultado es sencillamente extraordinario. Las recomendaciones, consejos y ejemplos de código de este libro le ayudarán a preentrenar y ajustar sus propios modelos fundacionales desde cero en AWS y Amazon SageMaker, a la vez que los aplica a cientos de casos de uso en toda su organización.


Con los consejos de la experimentada experta en AWS y aprendizaje automático Emily Webber, este libro le ayuda a aprender todo lo que necesita para pasar de la ideación del proyecto a la preparación de los conjuntos de datos, el entrenamiento, la evaluación y la implementación de grandes modelos de lenguaje, visión y multimodales. Con explicaciones paso a paso de conceptos esenciales y ejemplos prácticos, dominará el concepto del preentrenamiento, la preparación de sus conjuntos de datos y modelos, la configuración de su entorno, el entrenamiento, el ajuste, la evaluación, la implementación y la optimización de sus modelos fundacionales.


Aprenderá a aplicar las leyes de escalado a la distribución de su modelo y conjunto de datos en múltiples GPU, eliminar sesgos, lograr un alto rendimiento y construir flujos de trabajo de implementación.


Al final de este libro, estará bien equipado para embarcarse en su propio proyecto para preentrenar y ajustar los modelos fundacionales del futuro.


Lo que aprenderá:

  • Encuentre los casos de uso y los conjuntos de datos adecuados para el preentrenamiento y el ajuste fino.
  • Prepárese para el entrenamiento a gran escala con aceleradores y GPU personalizados.
  • Configure entornos en AWS y SageMaker para maximizar el rendimiento.
  • Seleccione los hiperparámetros en función de su modelo y las restricciones.
  • Distribuya su modelo y conjunto de datos utilizando muchos tipos de paralelismo.
  • Evite problemas con reinicios de trabajos, comprobaciones de estado intermitentes y más.
  • Evalúe su modelo con conocimientos cuantitativos y cualitativos.
  • Despliegue sus modelos con mejoras de tiempo de ejecución y flujos de trabajo de monitoreo.


A quién va dirigido este libro:

Si es un investigador o entusiasta del aprendizaje automático que desea iniciar un proyecto de modelado de fundamentos, este libro es para usted. Científicos aplicados, científicos de datos, ingenieros de aprendizaje automático, arquitectos de soluciones, gerentes de producto y estudiantes se beneficiarán de este libro. El Python intermedio es un requisito, junto con los conceptos introductorios de computación en la nube. Se necesita una sólida comprensión de los fundamentos del aprendizaje profundo, mientras que se explicarán temas avanzados. El contenido cubre técnicas avanzadas de aprendizaje automático y en la nube, explicándolas de una manera práctica y fácil de entender.

Autor: Emily Webber
Editorial: Packt Publishing
Publicado: 31/05/2023
Páginas: 258
Tipo de encuadernación: Tapa blanda
Peso: 0.99lbs
Tamaño: 9.25h x 7.50w x 0.54d
ISBN13: 9781804618257
ISBN10: 180461825X
Categorías BISAC:
- Informática | Inteligencia artificial | Procesamiento del lenguaje natural

Este título no es retornable