Construye un Modelo de Lenguaje Grande (desde cero)


Precio:
Precio de venta$79.98

Descripción

¡Aprende a crear, entrenar y ajustar grandes modelos de lenguaje (LLM) construyendo uno desde cero!

En Construye un modelo de lenguaje grande (desde cero), el autor superventas Sebastian Raschka te guía paso a paso a través de la creación de tu propio LLM. Cada etapa se explica con texto claro, diagramas y ejemplos. Irás desde el diseño y la creación inicial, hasta el preentrenamiento en un corpus general, y el ajuste fino para tareas específicas.

Construye un modelo de lenguaje grande (desde cero) te enseña cómo:

- Planificar y codificar todas las partes de un LLM
- Preparar un conjunto de datos adecuado para el entrenamiento de LLM
- Ajustar los LLM para la clasificación de texto y con tus propios datos
- Usar retroalimentación humana para asegurar que tu LLM siga instrucciones
- Cargar pesos preentrenados en un LLM

Construye un modelo de lenguaje grande (desde cero) te lleva dentro de la caja negra de la IA para manipular los sistemas internos que impulsan la IA generativa. A medida que avanzas por cada etapa clave de la creación de un LLM, desarrollarás una comprensión profunda de cómo funcionan los LLM, sus limitaciones y sus métodos de personalización. Tu LLM se puede desarrollar en una computadora portátil ordinaria y se puede usar como tu propio asistente personal.

La compra del libro impreso incluye un libro electrónico gratuito en formato PDF y ePub de Manning Publications.

Sobre la tecnología

El físico Richard P. Feynman supuestamente dijo: "No entiendo nada que no pueda construir". Basándose en este mismo principio poderoso, el autor superventas Sebastian Raschka te guía paso a paso mientras construyes un LLM estilo GPT que puedes ejecutar en tu computadora portátil. Este es un libro atractivo que cubre cada etapa del proceso, desde la planificación y la codificación hasta el entrenamiento y el ajuste fino.

Sobre el libro

Construye un modelo de lenguaje grande (desde cero) es un viaje práctico y eminentemente satisfactorio hacia los fundamentos de la IA generativa. Sin depender de ninguna biblioteca LLM existente, codificarás un modelo base, lo evolucionarás a un clasificador de texto y, finalmente, crearás un chatbot que puede seguir tus instrucciones conversacionales. ¡Y realmente lo entenderás porque lo construiste tú mismo!

Qué incluye

- Planificar y codificar un LLM comparable a GPT-2
- Cargar pesos preentrenados
- Construir un pipeline de entrenamiento completo
- Ajustar tu LLM para la clasificación de texto
- Desarrollar LLM que sigan instrucciones humanas

Acerca del lector

Los lectores necesitan habilidades intermedias de Python y algunos conocimientos de aprendizaje automático. El LLM que crees se ejecutará en cualquier computadora portátil moderna y, opcionalmente, puede utilizar GPU.

Sobre el autor

Sebastian Raschka es ingeniero de investigación en Lightning AI, donde trabaja en investigación de LLM y desarrolla software de código abierto.

El editor técnico de este libro fue David Caswell.

Tabla de Contenidos

1 Comprensión de los grandes modelos de lenguaje
2 Trabajar con datos de texto
3 Codificación de mecanismos de atención
4 Implementación de un modelo GPT desde cero para generar texto
5 Preentrenamiento con datos sin etiquetar
6 Ajuste fino para la clasificación
7 Ajuste fino para seguir instrucciones
A Introducción a PyTorch
B Referencias y lecturas adicionales
C Soluciones de ejercicios
D Añadiendo extras al bucle de entrenamiento
E Ajuste fino eficiente en parámetros con LoRA

Autor: Sebastian Raschka
Editorial: Manning Publications
Publicado: 29/10/2024
Páginas: 368
Tipo de encuadernación: Tapa blanda
Peso: 1.35 libras
Tamaño: 9.20h x 7.40w x 0.90d
ISBN13: 9781633437166
ISBN10: 1633437167
Categorías BISAC:
- Computación | Inteligencia Artificial | Sistemas Expertos
- Computación | Ciencia de Datos | Aprendizaje Automático
- Computación | Lenguajes | Python

Acerca del autor

Sebastian Raschka es ingeniero de investigación en Lightning AI, donde trabaja en investigación de LLM y desarrolla software de código abierto.

El editor técnico de este libro fue David Caswell.