Bases de datos probabilísticas


Precio:
Precio de venta$56.98

Descripción

Las bases de datos probabilísticas son bases de datos donde el valor de algunos atributos o la presencia de algunos registros son inciertos y conocidos solo con cierta probabilidad. Las aplicaciones en muchas áreas, como la extracción de información, RFID y la gestión de datos científicos, la limpieza de datos, la integración de datos y la evaluación de riesgos financieros, producen grandes volúmenes de datos inciertos, que se modelan y procesan mejor mediante una base de datos probabilística. Este libro presenta el estado del arte en formalismos de representación y técnicas de procesamiento de consultas para datos probabilísticos. Comienza discutiendo los principios básicos para representar grandes bases de datos probabilísticas, descomponiéndolas en tablas independientes de tuplas, tablas disjuntas independientes de bloques o bases de datos U. Luego, discute dos clases de técnicas para la evaluación de consultas en bases de datos probabilísticas. En la evaluación extensional de consultas, toda la inferencia probabilística puede insertarse en el motor de la base de datos y, por lo tanto, procesarse tan eficazmente como la evaluación de consultas SQL estándar. Las consultas relacionales que se pueden evaluar de esta manera se denominan consultas seguras. En la evaluación intencional de consultas, la inferencia probabilística se realiza sobre una fórmula proposicional llamada expresión de linaje: cada consulta relacional se puede evaluar de esta manera, pero la complejidad de los datos depende drásticamente de la consulta que se evalúa y puede ser #P-hard. El libro también analiza algunos temas avanzados en la gestión de datos probabilísticos, como el procesamiento de consultas top-k, las bases de datos probabilísticas secuenciales, la indexación y las vistas materializadas, y las bases de datos de Monte Carlo. Tabla de Contenidos: Resumen / Modelo de datos y consultas / El problema de la evaluación de consultas / Evaluación extensional de consultas / Evaluación intencional de consultas / Técnicas avanzadas

Autor: Dan Suciu, Dan Olteanu, Christopher Re
Editorial: Springer
Publicado: 01/06/2011
Páginas: 164
Tipo de encuadernación: Tapa blanda
Peso: 0.72 lbs
Tamaño: 9.25h x 7.50w x 0.39d
ISBN13: 9783031007514
ISBN10: 3031007514
Categorías BISAC:
- Informática | Administración y gestión de bases de datos
- Informática | Teoría de la información

Sobre el autor
Dan Suciu es profesor de Informática en la Universidad de Washington. Obtuvo su doctorado en la Universidad de Pensilvania en 1995, luego fue miembro principal del personal técnico en AT&T Labs hasta que se unió a la Universidad de Washington en 2000. El profesor Suciu está realizando investigaciones en gestión de datos, con énfasis en temas que surgen del intercambio de datos en Internet, como la gestión de datos semiestructurados y heterogéneos, la seguridad de los datos y la gestión de datos con incertidumbres. Es coautor del libro Data on the Web: from Relations to Semistructured Data and XML. Tiene doce patentes estadounidenses, recibió el Premio al Mejor Artículo SIGMOD de ACM en 2000, el Premio al Mejor Artículo de Diez Años de PODS en 2010, y es beneficiario del Premio NSF Career y de una Beca Alfred P. Sloan. Los estudiantes de doctorado de Suciu, Gerome Miklau y Christopher Re, recibieron el Premio a la Mejor Disertación SIGMOD de ACM en 2006 y 2010, respectivamente, y Nilesh Dalvi fue finalista en 2008. Dan Olteanu es profesor universitario (equivalente a profesor asistente en América del Norte) en el Departamento de Informática de la Universidad de Oxford y miembro del St. Cross College desde septiembre de 2007. Obtuvo su Dr. rer. nat. en Informática de la Universidad Ludwig Maximilian de Múnich en 2005. Antes de unirse a Oxford, fue investigador postdoctoral con el profesor Christoph Koch en la Universidad de Saarland, científico visitante en la Universidad de Cornell y profesor temporal en la Universidad Ruprecht Karl de Heidelberg. Su investigación principal se centra en aspectos teóricos y de sistemas de la gestión de datos, con un enfoque actual en datos web, información de procedencia y bases de datos probabilísticas. Christopher (Chris) Re es actualmente profesor asistente en el departamento de Ciencias de la Computación de la Universidad de Wisconsin-Madison. El objetivo de su trabajo es permitir a los usuarios y desarrolladores construir aplicaciones que comprendan más profundamente los datos. En muchas aplicaciones, las máquinas solo pueden comprender el significado de los datos estadísticamente, por ejemplo, texto generado por el usuario o datos de sensores. Para abordar este desafío, el trabajo reciente de Chris es construir un sistema, Hazy, que integre un puñado de operadores estadísticos con un sistema estándar de gestión de bases de datos relacionales. Para apoyar este trabajo, Chris recibió el Premio NSF CAREER en 2011. Chris obtuvo su doctorado en la Universidad de Washington, Seattle, bajo la supervisión de Dan Suciu. Por su trabajo de doctorado en el área de gestión de datos probabilísticos, Chris recibió el Premio a la Disertación Jim Gray SIGMOD 2010. Su trabajo de doctorado produjo dos sistemas: Mystiq, un sistema para gestionar datos probabilísticos relacionales, y Lahar, una base de datos probabilística de streaming. Christoph Koch es profesor de Informática en la Ecole Polytechnique Federale de Lausanne (EPFL) en Lausana, Suiza. Está interesado tanto en los aspectos teóricos como en los de sistemas de la gestión de datos, y actualmente trabaja en la gestión de datos inciertos y probabilísticos, la investigación en la intersección de bases de datos, lenguajes de programación y compiladores, sistemas de gestión de datos comunitarios y juegos basados en datos. Recibió su doctorado de la TU Viena, Austria, en 2001, por investigaciones realizadas en el CERN, Suiza, y posteriormente ocupó cargos en la TU Viena (2001-2002; 2003-2005), la Universidad de Edimburgo (2002-2003), la Universidad de Saarland (2005-2007) y la Universidad de Cornell (2006; 2007-2010), antes de unirse a la EPFL en 2010. Ganó premios al mejor artículo en PODS 2002 y SIGMOD 2011, un Google Research Award (2009), y ha sido copresidente de PC de DBPL 2005, WebDB 2008 e ICDE 2011.

Este título no es retornable