Descripción
Este libro le enseñará los conceptos subyacentes de los modelos de lenguaje grande (LLM), así como las tecnologías asociadas a ellos.
El libro comienza con una introducción al auge de las IA conversacionales como ChatGPT, y cómo se relacionan con el espectro más amplio de los modelos de lenguaje grandes. A partir de ahí, aprenderá sobre el procesamiento del lenguaje natural (NLP), sus conceptos centrales y cómo ha llevado al auge de los LLM. A continuación, obtendrá información sobre los transformadores y cómo sus características, como la autoatención, mejoran las capacidades del modelado de lenguaje, junto con las capacidades únicas de los LLM. El libro concluye con una exploración de las arquitecturas de varios LLM y las oportunidades que presentan sus capacidades cada vez mayores, así como los peligros de su mal uso.
Después de completar este libro, tendrá una comprensión exhaustiva de los LLM y estará listo para dar sus primeros pasos en su implementación en sus propios proyectos.
Lo que aprenderá
- Comprenderá los conceptos subyacentes de los LLM
- Obtendrá información sobre cómo los conceptos y enfoques del NLP han evolucionado a lo largo de los años
- Entenderá los modelos de transformadores y los mecanismos de atención
- Explorará diferentes tipos de LLM y sus aplicaciones
- Comprenderá las arquitecturas de los LLM populares
- Profundizará en los conceptos erróneos y las preocupaciones sobre los LLM, así como la mejor manera de utilizarlos
A quién va dirigido este libro
Cualquier persona interesada en aprender los conceptos fundamentales de NLP, LLM y los avances recientes del aprendizaje profundoAutor: Thimira Amaratunga
Editorial: Apress
Publicado: 26/11/2023
Páginas: 156
Tipo de encuadernación: Tapa blanda
Peso: 0,56 libras
Tamaño: 9,21 alto x 6,14 ancho x 0,38 profundo
ISBN13: 9798868800160
ISBN10: 8868800160
Categorías BISAC:
- Computadoras | Inteligencia artificial | General

