Limpieza de datos


Precio:
Precio de venta$104.98

Descripción

La calidad de los datos es uno de los problemas más importantes en la gestión de datos, ya que los datos sucios a menudo conducen a resultados de análisis de datos imprecisos y decisiones comerciales incorrectas.

Se informa que los datos deficientes en las empresas y el gobierno de los EE. UU. cuestan billones de dólares al año. Múltiples encuestas muestran que los datos sucios son la barrera más común que enfrentan los científicos de datos. No es sorprendente que el desarrollo de soluciones de limpieza de datos efectivas y eficientes sea un desafío y esté plagado de profundos problemas teóricos y de ingeniería.

Este libro trata sobre la limpieza de datos, que se utiliza para referirse a todo tipo de tareas y actividades para detectar y reparar errores en los datos. En lugar de centrarnos en una tarea particular de limpieza de datos, ofrecemos una visión general del proceso de limpieza de datos de principio a fin, describiendo varios métodos de detección y reparación de errores, e intentamos anclar estas propuestas con múltiples taxonomías y puntos de vista. Específicamente, cubrimos cuatro de las tareas de limpieza de datos más comunes e importantes, a saber, detección de valores atípicos, transformación de datos, reparación de errores (incluida la imputación de valores faltantes) y deduplicación de datos. Además, debido a la creciente popularidad y aplicabilidad de las técnicas de aprendizaje automático, incluimos un capítulo que explora específicamente cómo se utilizan las técnicas de aprendizaje automático para la limpieza de datos y cómo se utiliza la limpieza de datos para mejorar los modelos de aprendizaje automático.

Este libro está destinado a servir como una referencia útil para investigadores y profesionales interesados en el área de calidad y limpieza de datos. También se puede utilizar como libro de texto para un curso de posgrado. Aunque nuestro objetivo es cubrir algoritmos y técnicas de vanguardia, reconocemos que la limpieza de datos sigue siendo un campo activo de investigación y, por lo tanto, proporcionamos futuras direcciones de investigación siempre que sea apropiado.



Autor: Ihab F. Ilyas, Xu Chu
Editorial: Association for Computing Machinery
Publicado: 18/06/2019
Páginas: 282
Tipo de encuadernación: Tapa blanda
Peso: 1.08lbs
Tamaño: 9.25h x 7.50w x 0.59d
ISBN13: 9781450371537
ISBN10: 1450371531
Categorías BISAC:
- Computadoras | Administración y gestión de bases de datos
- Computadoras | Administración de sistemas | Almacenamiento y recuperación
- Computadoras | Ciencia de datos | General