Principios y flujo de trabajo de la secuenciación de bisulfito de todo el genoma
Principios de la secuenciación de bisulfito de todo el genoma
Los estudios epigenéticos han confirmado que la modificación de la metilación del ADN de regiones genéticas específicas juega un papel importante en la conformación del cromosoma y en la regulación de la expresión génica. La metilación de los residuos de citosina del ADN en el C5 (5meC) es una marca epigenética común en muchos eucariotas y se encuentra ampliamente en CpG o CpHpG (H=A, T, C). Existen principalmente tres enfoques, que incluyen la digestión con endonucleasas, el enriquecimiento por afinidad y la conversión a bisulfito (Tabla 1). Casi todos los enfoques de análisis de metilación del ADN específicos de la secuencia requieren un tratamiento dependiente de la metilación antes de la amplificación o hibridación para mantener la fidelidad. Posteriormente se llevan a cabo diversas técnicas de biología molecular, como la secuenciación de próxima generación (NGS), para detectar los residuos de 5meC.
Tabla 1. Principios principales del análisis de metilación basado en NGS.
Digestión enzimática |
Enriquecimiento por afinidad |
Bisulfito de sodio |
|
Principios |
Algunas enzimas de restricción, como HpaII y SmaI, son inhibidas por 5meC en el CpG. | El enriquecimiento por afinidad utiliza anticuerpos específicos para el 5meC o proteínas de unión a metilo con afinidad para perfilar la metilación del ADN. | El bisulfito de sodio convierte químicamente la citosina no metilada en uracilo, permitiendo así la detección de la metilación. |
Ejemplo de método |
Methyl-seq
*MCA-seq *HELP-seq *MSCC |
*MeDIP-seq
*MIRA-seq |
*RRBS
*WGBS *BSPP |
*MCA: Amplificación de islas CpG metiladas; *HELP: Enriquecimiento de fragmentos diminutos HpaII por PCR mediada por ligadura; *MSCC: recuento de cortes sensibles a la metilación; *MeDIP-seq: inmunoprecipitación de ADN metilado; *MIRA: ensayo de recuperación de islas CpG metiladas; *RRBS: secuenciación por bisulfito de representación reducida; *WGBS: secuenciación por bisulfito del genoma completo; *BSPP: sondas de candado de bisulfito.
La conversión por bisulfito supuso una revolución en el análisis de la metilación del genoma en la década de 1990. Dado que el bisulfito puede convertir las citosinas no metiladas del genoma en uracilos y luego reemplazarlas por timinas durante la amplificación por PCR, las cuales pueden distinguirse de la citosina originalmente modificada por metilación contando las citosinas y timinas para cada posición después de la secuenciación (Figura 1). La secuenciación del genoma completo con bisulfito (WGBS), como método de investigación de gran importancia en este campo, aplica una combinación de tratamiento con bisulfito y tecnologías de secuenciación de próxima/tercera generación (principalmente, secuenciación de escopeta) para estudiar la metilación del ADN a nivel genómico.
Figura 1. Conversión a bisulfito y amplificación por PCR antes de la secuenciación del ADN.
Ventajas de la secuenciación a bisulfito de todo el genoma.
- Posibilitar el perfil de metilación de todo el genoma a nivel de una sola base.
- Evaluar el estado de metilación de casi todos los locus CpG, incluidos los «desiertos génicos» intergénicos, los dominios de metilación parcial y los elementos reguladores remotos.
- Revelar los niveles absolutos de metilación del ADN y el fondo de la secuencia de metilación.
Flujo de trabajo de la secuenciación del genoma completo con bisulfito
En resumen, los pasos básicos de la secuenciación del genoma completo con bisulfito (WGBS) incluyen la extracción del ADN, la conversión a bisulfito, la preparación de la biblioteca, la secuenciación y el análisis bioinformático. Aquí utilizamos Illumina HiSeq como ejemplo para ilustrar el flujo de trabajo de WGBS.
Figura 2. El flujo de trabajo de la secuenciación del genoma completo por bisulfito (Khanna et al. 2013).
- Extracción de ADN
En primer lugar, se preparan aproximadamente 1-5 mg de muestras de tejido recogidas de seres humanos, animales, plantas o microorganismos para el ADN. En general, las muestras para la secuenciación del genoma completo por bisulfito deben cumplir las cuatro características siguientes.
i. Eucariotas;
ii. Hipometilación (como se muestra en la Figura 3, los estudios han demostrado que una vez que el número de sitios CpG en una región aumenta, los datos de secuenciación de WGBS comienzan a disminuir);
iii. Su genoma de referencia ha sido ensamblado al menos hasta el nivel de andamiaje;
iv. Anotaciones del genoma relativamente completas. Y luego, aplicar un kit adecuado para extraer ADN de alta pureza y alto peso molecular. El ADN extraído debe tener una masa no inferior a 5 μg, una concentración no inferior a 50 ng/ul y una DO260/280 de 1,8 a 2,0.
Figura 3. La tecnología WGBS convencional tiene una baja cobertura de los sitios de metilación (Raine et al. 2016)
- Conversión al bisulfito
La conversión al bisulfito se considera el «estándar de oro» para el análisis de la metilación del ADN, los principios se han mostrado en la Figura 4. Para este método, la degradación del ADN inducida por el BS puede conducir a la disminución de las regiones genómicas enriquecidas en citosinas no metiladas. Por lo tanto, es importante evaluar la cantidad de degradación del ADN en las condiciones de la reacción, y también debe considerarse cómo afecta esto al amplicón deseado. Olova et al. (2018) encontraron que la degradación del ADN es fuerte en los protocolos de conversión de bisulfito que utilizan una alta desnaturalización o una alta molaridad de bisulfito. Hay varios kits disponibles en el mercado (Tabla 2).
Figura 4. Desaminación de la citosina mediada por bisulfito (Hayatsu et al. 2004).
Tabla 2. Protocolos y parámetros de conversión a bisulfito.
Kits | Denaturación | Temperatura de conversión | Tiempo de incubación |
Zymo EZ DNA Methylation Lightning Kit | Basado en calor; 99 °C Basado en alcalinos; 37 °C |
65 °C | 90 minutos |
EpiTect Bisulfite kit (Qiagen) | Basado en calor; 99 °C | 55 °C | 10 horas |
EZ DNA Methylation Kit (Zymo Research) | Basado en alcalinos; 37 °C | 50 °C | 12-16 horas |
- Preparación de la biblioteca
Toma como ejemplo el EpiGnomeTM Methyl-Seq Kit (Epicentre) El ADN monocatenario tratado con bisulfito se ceba al azar utilizando una polimerasa capaz de leer nucleótidos de uracilo, para sintetizar el ADN que contiene una etiqueta de secuencia específica. A continuación, el extremo 3′ de la cadena de ADN recién sintetizada se etiqueta selectivamente con una segunda secuencia específica, con lo que se puede obtener un ADN molecular de dos marcas con una etiqueta de secuencia conocida en los extremos 5′ y 3′. Los adaptadores Illumina P7 y P5 se añaden posteriormente por PCR en los extremos 5 y 3 antes de la secuenciación del ADN.
Figura 5. Flujo de trabajo del kit EpiGnomeTM Methyl-Seq.
- Secuenciación
La tecnología de secuenciación Hiseq, un novedoso método de secuenciación basado en la secuenciación por síntesis (SBS), se aplica ampliamente para la WGBS. La amplificación por puente en una celda de flujo se logra mediante el uso de una matriz de una sola molécula. Como la nueva técnica de bloqueo reversible puede sintetizar sólo una base a la vez y etiquetar el fluoróforo, el láser correspondiente se utiliza para excitar el fluoróforo, y la luz de excitación puede ser capturada para leer la información de la base. La estrategia Paired-end 150 bp se emplea normalmente en WGBS para secuenciar bibliotecas de ADN tratadas con bisulfito de inserción de 250-300 bp. Además de Illumina HiSeq, PacBio SMRT, Nanopore, Roche 454 y otras plataformas de Illumina también se utilizan habitualmente para este fin.
- Análisis de datos
Se pueden realizar una serie de análisis para los resultados de la secuenciación. En la Tabla 3 se enumeran cinco tipos principales de análisis de información. Además, se pueden realizar análisis de densidad de metilación, análisis de regiones metiladas diferencialmente (DMR), anotación de DMR y análisis de enriquecimiento (GO/KEGG) y análisis de clustering. Los recursos bioinformáticos comunes de WGBS incluyen BDPC, CpGcluster, CpGFinder, Epinexus, MethTools, mPod, QUMA y TCGA Data Portal.
Tabla 3. Principales tipos de análisis de datos WGBS.
Tipo | Detalles |
Alineación contra el genoma de referencia | Las herramientas, como el software SOAP, se utilizan para comparar las lecturas con la secuencia del genoma de referencia, y sólo las lecturas alineadas se utilizarán para el análisis de la información de metilación. Alinear las lecturas permitiendo coincidencias C-C y desajustes C-T. |
Llamada de mC | Determinar la posición de mC en todo el genoma. Los ratios de mC se calculan teniendo en cuenta la calidad de la lectura y las probabilidades de mapeo multilocus. Descarta la alineación de pequeña probabilidad que tiene una baja fiabilidad de alineación. |
Análisis de la profundidad de la secuencia y de la cobertura | Una imagen que refleja la relación entre la cobertura del gen y la profundidad de la secuenciación determina si el descubrimiento de la metilación puede hacerse con un cierto grado de confianza en posiciones de base específicas. |
Análisis del nivel de metilación | El nivel de metilación de cada base C metilada se calcula como sigue: 100*lecturas/total de lecturas. El nivel medio de metilación de todo el genoma refleja las características generales del perfil de metilación del genoma. |
Tendencias globales del metiloma | La relación de distribución de CG, CHGG y CHH en las bases C metiladas refleja hasta cierto punto las características de los mapas de metilación de todo el genoma de especies específicas. |
Servicios destacados:
Secuenciación bisulfítica de todo el genoma
Secuenciación bisulfítica dirigida
ChIP-seq
Secuenciación bisulfítica de representación reducida
- Fraga, M. F., Esteller, M. (2002). Metilación del adn: un perfil de métodos y aplicaciones. Biotechniques, 33(3), 636-49.
- Green, R. E., Krause, J., Briggs, A. W., Maricic, T., Stenzel, U., et al. (2010). A Draft Sequence of the Neandertal Genome. Science, 328(5979), 710-722.
- Hayatsu, H., Negishi, K., & Shiraishi, M. (2004). Análisis de metilación del ADN: aceleración de la desaminación de la citosina mediada por bisulfito en el procedimiento de secuenciación genómica. Proceedings of the Japan Academy,80(4), 189-194.
- Herman, J. G., Graff, J. R., Myöhänen, S., Nelkin, B. D., & Baylin, S. B. (1996). Methylation-specific pcr: a novel pcr assay for methylation status of cpg islands. Proceedings of the National Academy of Sciences of the United States of America, 93(18), 9821-9826.
- Ji, L., Sasaki, T., Sun, X., Ma, P., Lewis, Z. A., & Schmitz, R. J. (2014). El ADN metilado está sobrerrepresentado en los datos de secuenciación de bisulfitos del genoma completo. Front Genet, 5(5), 341.
- Khanna, A., Czyz, A., & Syed, F. (2013). Epignome methyl-seq kit: a novel post-bisulfite conversion library prep method for methylation analysis. Nature Methods, 10(10).
- Laird, P. W. (2003). The power and the promise of DNA methylation markers. Nature Reviews Cancer, 3(4), 253-266. doi:10.1038/nrc1045
- Laura-Jayne, G., Mark, Q. T., Lisa, O., Jonathan, P., Neil, H., &Anthony, H. (2015). A genome-wide survey of dna methylation in hexaploid wheat. Genome Biology, 16(1), 273.
- Lin Liu, Ni Hu, Bo Wang, Minfeng Chen, Juan Wang, & Zhijian Tian, et al. (2011). Un breve informe de utilización del secuenciador illumina hiseq 2000. Mycology, 2(3), 169-191.
- Meissner, A., Gnirke, A., Bell, G. W., Ramsahoye, B., Lander, E. S., & Jaenisch, R. (2005). Representación reducida bisulfito secuenciación para el análisis comparativo de alta resolución de metilación del ADN. Nucleic Acids Research, 33(18), 5868-77.
- Meyer, M., Kircher, M., Gansauge, M. T., Li, H., Racimo, F., & Mallick, S., et al. (2012). Una secuencia del genoma de alta cobertura de un individuo denisovano arcaico. Science, 338(6104), 222-6.
- Olova, N., Krueger, F., Andrews, S., Oxley, D., Berrens, R. V., & Branco, M. R., et al. (2018). La comparación de las estrategias de preparación de bibliotecas de secuenciación de bisulfito del genoma completo identifica fuentes de sesgos que afectan a los datos de metilación del adn. Genome Biology, 19(1), 33.
- Raine, A., Manlig, E., Wahlberg, P., Syvänen, A. C., & Nordlund, J. (2016). Splinted ligation adapter tagging (splat), un nuevo método de preparación de bibliotecas para la secuenciación del genoma completo con bisulfito. Nucleic Acids Research, 45(6), e36.
- Ziller, M. J., Müller, F., Liao, J., Zhang, Y., Gu, H., & Bock, C., et al. (2011). Genomic distribution and inter-sample variation of non-cpg methylation across human cell types. Plos Genetics, 7(12), e1002389.