Descripción
Los datos de series temporales son cada vez más importantes, especialmente con la rápida expansión del Internet de las Cosas. Esta concisa guía le muestra formas efectivas de recopilar, conservar y acceder a datos de series temporales a gran escala para su análisis. Explorará la teoría detrás de las bases de datos de series temporales y aprenderá métodos prácticos para implementarlas. Los autores Ted Dunning y Ellen Friedman brindan un examen detallado de herramientas de código abierto como OpenTSDB y nuevas modificaciones que aceleran enormemente la ingesta de datos.
Aprenderás:
- Una variedad de casos de uso de series temporales
- Las ventajas de las bases de datos NoSQL para datos de series temporales a gran escala
- Diseño de tablas NoSQL para bases de datos de series temporales de alto rendimiento
- Los beneficios y limitaciones de OpenTSDB
- Cómo acceder a los datos en OpenTSDB usando R, Go y Ruby
- Cómo las bases de datos de series temporales contribuyen a proyectos prácticos de aprendizaje automático
- Cómo manejar la complejidad adicional de los datos geoespaciales
Para obtener consejos sobre el análisis de datos de series temporales, consulte Practical Machine Learning: A New Look at Anomaly Detection, también de Ted Dunning y Ellen Friedman.
Autor: Ted Dunning, Ellen Friedman
Editorial: O'Reilly Media
Publicado: 30/12/2014
Páginas: 82
Tipo de encuadernación: Tapa blanda
Peso: 0.27lbs
Tamaño: 9.00h x 6.00w x 0.17d
ISBN13: 9781491914724
ISBN10: 1491914726
Categorías BISAC:
- Computadoras | Ciencia de datos | Análisis de datos
- Computadoras | Administración y gestión de bases de datos
Acerca del autor
Ted Dunning es arquitecto jefe de aplicaciones en MapR Technologies y participa activamente en la comunidad de código abierto, siendo committer y miembro de la PMC de los proyectos Apache Mahout, Apache ZooKeeper y Apache Drill, y sirve como mentor para estos proyectos de Apache: Storm, Flink, Optiq, Datafu y Drill. Ha contribuido a los algoritmos de agrupación, clasificación y descomposición matricial de Mahout y a la nueva biblioteca Mahout Math, y recientemente diseñó el algoritmo t-digest utilizado en varios proyectos de código abierto. También fue el arquitecto de las modificaciones para Open TSDB descritas en este libro.
Ted fue el arquitecto jefe detrás de los sistemas de recomendación de MusicMatch (ahora Yahoo Music) y Veoh, construyó sistemas de detección de fraude para ID Analytics (LifeLock) y ha emitido 24 patentes hasta la fecha. Ted tiene un doctorado en ciencias de la computación de la Universidad de Sheffield. Cuando no está haciendo ciencia de datos, toca la guitarra y la mandolina. Ted está en Twitter en @ted_dunning.
Ellen Friedman es consultora de soluciones y una conocida oradora y autora, actualmente escribe principalmente sobre temas de big data. Es committer del proyecto Apache Mahout y colaboradora del proyecto Apache Drill. Con un doctorado en Bioquímica, tiene años de experiencia como científica investigadora y ha escrito sobre una variedad de temas técnicos, incluyendo biología molecular, herencia no tradicional y oceanografía. Ellen también es coautora de un libro de caricaturas con temática mágica, A Rabbit Under the Hat. Ellen está en Twitter en @Ellen_Friedman.

