Descripción
¿Qué son los datos erróneos? Algunas personas lo consideran un fenómeno técnico, como valores perdidos o registros mal formados, pero los datos erróneos incluyen mucho más. En este manual, el experto en datos Q. Ethan McCallum ha reunido a 19 colegas de todos los rincones del ámbito de los datos para revelar cómo se han recuperado de desagradables problemas de datos.
Desde el almacenamiento defectuoso hasta la representación deficiente y las políticas equivocadas, hay muchos caminos hacia los datos erróneos. ¿La conclusión? Los datos erróneos son datos que estorban. Este libro explica formas efectivas de sortearlos.
Entre los muchos temas cubiertos, descubrirá cómo:
- Probar sus datos para ver si están listos para el análisis
- Convertir datos de hojas de cálculo a un formato utilizable
- Manejar problemas de codificación que acechan en los datos de texto
- Desarrollar un esfuerzo exitoso de web scraping
- Usar herramientas de PNL para revelar el verdadero sentimiento de las reseñas en línea
- Abordar los problemas de computación en la nube que pueden afectar su esfuerzo de análisis
- Evitar políticas que creen obstáculos para el análisis de datos
- Adoptar un enfoque sistemático para el análisis de la calidad de los datos
Autor: Q. McCallum
Editorial: O'Reilly Media
Publicado: 18/12/2012
Páginas: 262
Tipo de encuadernación: Tapa blanda
Peso: 0.94lbs
Tamaño: 9.05h x 7.00w x 0.57d
ISBN13: 9781449321888
ISBN10: 1449321887
Categorías BISAC:
- Informática | Administración y gestión de bases de datos
- Informática | Ciencia de datos | Almacenamiento de datos
- Informática | Ciencia de datos | Análisis de datos
Sobre el autor
Q Ethan McCallum es consultor, escritor y entusiasta de la tecnología, aunque quizás no en ese orden. Su trabajo ha aparecido en línea en The O'Reilly Network y Java.net, y también en publicaciones impresas como C/C++ Users Journal, Doctor Dobb's Journal y Linux Magazine. En sus roles profesionales, ayuda a las empresas a tomar decisiones inteligentes sobre datos y tecnología.
"
