Descripción
Ahora que la gente es consciente de que los datos pueden marcar la diferencia en una elección o un modelo de negocio, la ciencia de datos como ocupación está ganando terreno. Pero, ¿cómo empezar a trabajar en un campo interdisciplinario y de amplio alcance tan nublado por la exageración? Este libro perspicaz, basado en la clase de Introducción a la Ciencia de Datos de la Universidad de Columbia, le dice lo que necesita saber.
En muchas de estas conferencias de un capítulo de duración, científicos de datos de empresas como Google, Microsoft y eBay comparten nuevos algoritmos, métodos y modelos presentando estudios de casos y el código que utilizan. Si está familiarizado con el álgebra lineal, la probabilidad y la estadística, y tiene experiencia en programación, este libro es una introducción ideal a la ciencia de datos.
Los temas incluyen:
- Inferencia estadística, análisis exploratorio de datos y el proceso de la ciencia de datos
- Algoritmos
- Filtros de spam, Naive Bayes y manipulación de datos
- Regresión logística
- Modelado financiero
- Motores de recomendación y causalidad
- Visualización de datos
- Redes sociales y periodismo de datos
- Ingeniería de datos, MapReduce, Pregel y Hadoop
Doing Data Science es una colaboración entre la instructora del curso Rachel Schutt, vicepresidenta sénior de ciencia de datos en News Corp, y la consultora de ciencia de datos Cathy O'Neil, científica de datos sénior en Johnson Research Labs, quien asistió y escribió sobre el curso.
Autor: Cathy O'Neil, Rachel Schutt
Editorial: O'Reilly Media
Publicado: 19/11/2013
Páginas: 408
Tipo de encuadernación: Tapa blanda
Peso: 1.20 libras
Tamaño: 9.00h x 6.00w x 0.90d
ISBN13: 9781449358655
ISBN10: 1449358659
Categorías BISAC:
- Matemáticas | Probabilidad y Estadística | Series Temporales
- Informática | Ciencia de Datos | Análisis de Datos
- Matemáticas | Probabilidad y Estadística | Análisis Bayesiano
Acerca del autor
Cathy O'Neil obtuvo un doctorado en matemáticas de Harvard, fue becaria postdoctoral en el departamento de matemáticas del MIT y profesora en Barnard College, donde publicó varios trabajos de investigación en geometría algebraica aritmética. Luego lo abandonó y se pasó al sector privado. Trabajó como "quant" para el fondo de cobertura D.E. Shaw en plena crisis crediticia, y luego para RiskMetrics, una empresa de software de riesgo que evalúa el riesgo de las carteras de fondos de cobertura y bancos. Actualmente es científica de datos en la escena de start-ups de Nueva York, escribe un blog en mathbabe.org y está involucrada con Occupy Wall Street.
Rachel Schutt es la vicepresidenta sénior de Ciencia de Datos en News Corp. Obtuvo un doctorado en Estadística de la Universidad de Columbia y fue estadística en Google Research durante varios años. Es profesora adjunta en el Departamento de Estadística de Columbia y miembro fundador del Comité de Educación del Instituto de Ciencias e Ingeniería de Datos de Columbia. Tiene varias patentes pendientes basadas en su trabajo en Google, donde ayudó a construir productos orientados al usuario prototipando algoritmos y construyendo modelos para comprender el comportamiento del usuario. Tiene una maestría en matemáticas de la NYU y una maestría en Sistemas de Ingeniería-Economía e Investigación de Operaciones de la Universidad de Stanford. Su licenciatura es en Matemáticas con Honores de la Universidad de Michigan.

