Embeddings en procesamiento del lenguaje natural: teoría y avances en representaciones vectoriales del significado


Precio:
Precio de venta$89.98

Descripción

Las incrustaciones (Embeddings) han sido, sin duda, una de las áreas de investigación más influyentes en el Procesamiento del Lenguaje Natural (PLN). La codificación de información en una representación vectorial de baja dimensión, que es fácilmente integrable en los modelos modernos de aprendizaje automático, ha desempeñado un papel central en el desarrollo del PLN. Las técnicas de incrustación se centraron inicialmente en las palabras, pero la atención pronto empezó a desviarse hacia otras formas: desde estructuras gráficas, como las bases de conocimiento, hasta otros tipos de contenido textual, como oraciones y documentos. Este libro ofrece una síntesis de alto nivel de las principales técnicas de incrustación en PLN, en el sentido más amplio. El libro comienza explicando los modelos convencionales de espacio vectorial de palabras y las incrustaciones de palabras (por ejemplo, Word2Vec y GloVe) y luego pasa a otros tipos de incrustaciones, como el sentido de la palabra, la oración y el documento, y las incrustaciones de grafos. El libro también ofrece una visión general de los desarrollos recientes en representaciones contextualizadas (por ejemplo, ELMo y BERT) y explica su potencial en el PLN. A lo largo del libro, el lector puede encontrar tanto información esencial para comprender un tema determinado desde cero como una visión general de las técnicas más exitosas desarrolladas en la literatura.

Autor: Mohammad Taher Pilehvar, Jose Camacho-Collados
Editorial: Springer
Publicado: 13/11/2020
Páginas: 157
Tipo de encuadernación: Tapa blanda
Peso: 0.69 libras
Tamaño: 9.25 alto x 7.50 ancho x 0.38 profundidad
ISBN13: 9783031010491
ISBN10: 3031010493
Categorías BISAC:
- Computadoras | Inteligencia Artificial | Procesamiento del Lenguaje Natural
- Artes del Lenguaje y Disciplinas | Lingüística | Semántica
- Computadoras | Procesamiento de Voz y Audio

Sobre el autor
Mohammad Taher Pilehvar es profesor asistente en el Instituto de Estudios Avanzados de Teherán (TeIAS) y profesor afiliado en la Universidad de Cambridge. La investigación de Taher se centra principalmente en la semántica léxica, con especial énfasis en el aprendizaje de representaciones para los sentidos de las palabras. Taher ha impartido múltiples tutoriales en conferencias *ACL y ha coorganizado cuatro tareas de SemEval y un taller de la EACL sobre representación semántica. Taher ha contribuido al campo de la semántica léxica con varias publicaciones en los últimos años, incluyendo dos nominaciones a mejor artículo en ACL (2013 y 2017) y una encuesta sobre representaciones vectoriales del significado. Jose Camacho-Collados es un UKRI Future Leaders Fellow y profesor en la Facultad de Ciencias de la Computación e Informática de la Universidad de Cardiff (Reino Unido). Anteriormente, fue Google Doctoral Fellow, completó su doctorado en la Universidad Sapienza de Roma (Italia) y tuvo experiencia predoctoral como ingeniero de investigación estadística en Francia. Su formación incluye un máster Erasmus Mundus en Tecnología del Lenguaje Humano y una licenciatura de 5 años en Matemáticas (España). El área principal de especialización de Jose es el Procesamiento del Lenguaje Natural (PLN), particularmente la semántica computacional o, en otras palabras, cómo hacer que las computadoras entiendan el lenguaje. En este tema, junto con Taher Pilehvar, ha escrito una encuesta muy bien recibida sobre las representaciones vectoriales del significado, que fue publicada en el Journal of Artificial Intelligence Research y estableció la base de este libro. Su investigación ha girado en torno a contribuciones científicas a través de publicaciones regulares en los principales foros de IA y PLN como ACL, EMNLP, AAAI e IJCAI, y aplicaciones con impacto directo en la sociedad, con un enfoque especial en las redes sociales y la multilingüismo. También ha organizado varios talleres internacionales, tutoriales y desafíos abiertos con cientos de participantes en todo el mundo.

Este título no es retornable