Genómica en la nube: uso de Docker, GATK y WDL en Terra


Precio:
Precio de venta$89.99

Descripción

Los datos en el campo de la genómica están en auge. En pocos años, organizaciones como los Institutos Nacionales de Salud (NIH) albergarán más de 50 petabytes, o más de 50 millones de gigabytes, de datos genómicos, y están recurriendo a la infraestructura en la nube para poner esos datos a disposición de la comunidad investigadora. ¿Cómo se adaptan las herramientas y protocolos de análisis para acceder y analizar ese volumen de datos en la nube?

Con este libro práctico, los investigadores aprenderán a trabajar con algoritmos genómicos utilizando herramientas de código abierto como Genome Analysis Toolkit (GATK), Docker, WDL y Terra. Geraldine Van der Auwera, custodio de la comunidad de usuarios de GATK desde hace mucho tiempo, y Brian O'Connor del Instituto de Genómica de la UC Santa Cruz, le guiarán a través del proceso. Aprenderá trabajando con datos reales y algoritmos genómicos del campo.

Este libro cubre:

  • Antecedentes esenciales de la genómica y la tecnología informática
  • Operaciones básicas de computación en la nube
  • Introducción a GATK, además de tres de las principales tuberías de mejores prácticas de GATK
  • Automatización del análisis con flujos de trabajo programados usando WDL y Cromwell
  • Ampliación de la ejecución del flujo de trabajo en la nube, incluyendo la paralelización y la optimización de costos
  • Análisis interactivo en la nube usando cuadernos Jupyter
  • Colaboración segura y reproducibilidad computacional usando Terra


Autor: Geraldine A. Van Der Auwera, Brian D. O'Connor
Editorial: O'Reilly Media
Publicado: 21/04/2020
Páginas: 496
Tipo de encuadernación: Tapa blanda
Peso: 1.72lbs
Tamaño: 9.17h x 7.01w x 1.00d
ISBN13: 9781491975190
ISBN10: 1491975199
Categorías BISAC:
- Ciencia | Bioinformática
- Informática | Ciencia de Datos | Análisis de Datos
- Informática | Software Matemático y Estadístico

Acerca del autor

La Dra. Geraldine A. Van der Auwera es Directora de Extensión y Comunicación de la Plataforma de Ciencias de Datos (DSP) en el Broad Institute of MIT and Harvard. Como parte de su función de extensión, actúa como educadora y defensora de los investigadores que utilizan el software y los servicios de DSP, incluyendo GATK, el kit de herramientas líder de la industria de Broad para el análisis de descubrimiento de variantes; el sistema de gestión de flujo de trabajo Cromwell/WDL; y Terra.bio, una plataforma de análisis basada en la nube que integra recursos computacionales, un repositorio de métodos y gestión de datos en un entorno fácil de usar. Van der Auwera fue originalmente microbióloga, obtuvo su doctorado en Ingeniería Biológica en la Université catholique de Louvain (UCL) en Bélgica en 2007, y luego sobrevivió a una estancia postdoctoral de 4 años en la Harvard Medical School. Se unió al Broad Institute en 2012 para convertirse en la Dictadora Benevolente de por Vida de la comunidad de usuarios de GATK, dejando atrás el trabajo de laboratorio y de pipeteo para siempre.

El Dr. Brian O'Connor es el Director de la Plataforma de Genómica Computacional en el Instituto de Genómica de la Universidad de California en Santa Cruz (UCSC). Allí, se enfoca en el desarrollo e implementación de sistemas a gran escala basados en la nube para analizar datos genómicos. Estos incluyen las plataformas NHGRI AnVIL y NHLBI Bio Data Catalyst, así como el sitio Dockstore para compartir flujos de trabajo y herramientas. Brian participa activamente en los esfuerzos de estandarización y es copresidente del Grupo de Trabajo de la Nube de la Alianza Global para la Genómica y la Salud, donde trabaja en estándares de API para la interoperabilidad en la nube. Brian se unió a la UCSC desde el Ontario Institute for Cancer Research, donde sus proyectos anteriores incluyeron liderar la implementación técnica de sistemas de análisis globales basados en la nube para el proyecto PanCancer Analysis of Whole Genomes, la creación de Dockstore y la gestión de una exitosa reconstrucción del Portal de Datos del Consorcio Internacional de Genomas del Cáncer.