Fundamentos de Ciencia de Datos en Python: Recopilar - Organizar - Explorar - Predecir - Valorar


Precio:
Precio de venta$41.08

Descripción

Pase de artefactos desordenados y no estructurados almacenados en bases de datos SQL y NoSQL a un conjunto de datos pulcro y bien organizado con esta referencia rápida para el atareado científico de datos. Comprenda la minería de texto, el aprendizaje automático y el análisis de redes; procese datos numéricos con los módulos NumPy y Pandas; describa y analice datos utilizando métodos estadísticos y de teoría de redes; y vea ejemplos reales de análisis de datos en acción. Esta solución integral cubre la ciencia de datos esencial que necesita en Python.

La ciencia de datos es una de las disciplinas de más rápido crecimiento en términos de investigación académica, matriculación de estudiantes y empleo. Python, con su flexibilidad y escalabilidad, está superando rápidamente al lenguaje R para proyectos de ciencia de datos. Tenga los conceptos de ciencia de datos de Python al alcance de su mano con esta referencia modular y rápida a las herramientas utilizadas para adquirir, limpiar, analizar y almacenar datos.

Esta solución integral cubre lo esencial de Python, bases de datos, análisis de redes, procesamiento de lenguaje natural, elementos de aprendizaje automático y visualización. Acceda a datos de texto y numéricos estructurados y no estructurados desde archivos locales, bases de datos e Internet. Organice, reorganice y limpie los datos. Trabaje con bases de datos relacionales y no relacionales, visualización de datos y análisis predictivo simple (regresiones, agrupamiento y árboles de decisión). Vea cómo se manejan los problemas típicos de análisis de datos. Y pruebe sus propias soluciones a una variedad de proyectos de mediana escala que son divertidos de trabajar y quedan bien en su currículum.

Tenga esta práctica guía rápida a su lado, ya sea que sea un estudiante, un profesional de la ciencia de datos de nivel inicial que se está convirtiendo de R a Python, o un desarrollador de Python experimentado que no quiere memorizar cada función y opción.

Lo que necesita:

Necesita una distribución decente de Python 3.3 o superior que incluya al menos NLTK, Pandas, NumPy, Matplotlib, Networkx, SciKit-Learn y BeautifulSoup. Una gran distribución que cumple con los requisitos es Anaconda, disponible de forma gratuita en www.continuum.io. Si planea configurar sus propios servidores de bases de datos, también necesita MySQL (www.mysql.com) y MongoDB (www.mongodb.com). Ambos paquetes son gratuitos y funcionan en Windows, Linux y Mac OS.

Autor: Dmitry Zinoviev
Editorial: Pragmatic Bookshelf
Publicado: 30/08/2016
Páginas: 226
Tipo de encuadernación: Tapa blanda
Peso: 0.87 libras
Tamaño: 9.25h x 7.50w x 0.48d
ISBN13: 9781680501841
ISBN10: 1680501844
Categorías BISAC:
- Informática | Lenguajes | Python
- Informática | Administración y Gestión de Bases de Datos
- Informática | Ciencia de Datos | Modelado y Diseño de Datos

Sobre el autor

Dmitry Zinoviev tiene una Maestría en Física de la Universidad Estatal de Moscú y un Doctorado en Ciencias de la Computación de la Universidad de Stony Brook. Sus intereses de investigación incluyen simulación y modelado por computadora, ciencia de redes, análisis de redes sociales y humanidades digitales. Ha estado enseñando en la Universidad de Suffolk en Boston, MA desde 2001.