Descripción
La ingeniería de características es un paso crucial en la cadena de desarrollo de aprendizaje automático, sin embargo, este tema rara vez se examina por sí solo. Con este libro práctico, aprenderá técnicas para extraer y transformar características —las representaciones numéricas de datos crudos— en formatos para modelos de aprendizaje automático. Cada capítulo le guía a través de un único problema de datos, como la representación de texto o datos de imagen. Juntos, estos ejemplos ilustran los principios principales de la ingeniería de características.
En lugar de simplemente enseñar estos principios, las autoras Alice Zheng y Amanda Casari se centran en la aplicación práctica con ejercicios a lo largo del libro. El capítulo final reúne todo al abordar un conjunto de datos estructurados del mundo real con varias técnicas de ingeniería de características. En los ejemplos de código se utilizan paquetes de Python como numpy, Pandas, Scikit-learn y Matplotlib.
Examinará:
- Ingeniería de características para datos numéricos: filtrado, agrupación en bins, escalado, transformaciones logarítmicas y transformaciones de potencia
- Técnicas de texto natural: bolsa de palabras, n-gramas y detección de frases
- Filtrado basado en frecuencia y escalado de características para eliminar características no informativas
- Técnicas de codificación de variables categóricas, incluyendo hashing de características y conteo de bins
- Ingeniería de características basada en modelos con análisis de componentes principales
- El concepto de apilamiento de modelos, usando k-means como técnica de featurización
- Extracción de características de imagen con técnicas manuales y de aprendizaje profundo
Autor: Alice Zheng, Amanda Casari
Editorial: O'Reilly Media
Publicado: 20/04/2018
Páginas: 218
Tipo de encuadernación: Tapa blanda
Peso: 0.70 libras
Tamaño: 9.10h x 7.00w x 0.40d
ISBN13: 9781491953242
ISBN10: 1491953241
Categorías BISAC:
- Informática | Ciencia de Datos | Análisis de Datos
- Informática | Ciencia de Datos | Modelado y Diseño de Datos
- Informática | Ciencia de Datos | Almacenamiento de Datos
Sobre el Autor
Alice es una líder técnica en el campo del Aprendizaje Automático. Su experiencia abarca el desarrollo de algoritmos y plataformas, así como sus aplicaciones. Actualmente, es Gerente Senior en Amazon's Ad Platform. Sus roles anteriores incluyen Directora de Ciencia de Datos en GraphLab/Dato/Turi, investigadora de aprendizaje automático en Microsoft Research, Redmond, y becaria postdoctoral en la Universidad Carnegie Mellon. Recibió un Doctorado en Ingeniería Eléctrica y Ciencias de la Computación, y licenciaturas en Ciencias de la Computación y Matemáticas, todo de la U.C. Berkeley.

