Articles

Princípios e Fluxo de Trabalho da Sequenciação de Bissulfito de Genoma Inteiro

Princípios da Sequenciação de Bissulfito de Genoma Inteiro

Estudos epidemiológicos confirmaram que a modificação da metilação do DNA de regiões genéticas específicas desempenha um papel importante na conformação cromossômica e na regulação da expressão gênica. A metilação de resíduos de DNA citosina na C5 (5meC) é uma marca epigenética comum em muitas eucariotas e é amplamente encontrada na CpG ou CpHpG (H=A, T, C). Existem principalmente três abordagens, incluindo a digestão por endonuclease, enriquecimento por afinidade e conversão de bissulfitos (Tabela 1). Quase todas as abordagens de análise de metilação de DNA específicas da sequência requerem um tratamento dependente da metilação antes da amplificação ou hibridização para manter a fidelidade. Várias técnicas de biologia molecular, como o sequenciamento de próxima geração (NGS), são posteriormente realizadas para detectar resíduos 5meC.

Tabela 1. Princípios principais da análise de metilação baseada em NGS.

>

>

*MCA: amplificação da ilha CpG metilada; *AJUDA: HpaII: enriquecimento de pequenos fragmentos por PCR mediado por ligadura; *MSCC: contagem de cortes sensíveis à metilação; *MeDIP-seq: imunoprecipitação de DNA metilado; *MIRA: ensaio de recuperação da ilha CpG metilada; *RRBS: sequenciação de bissulfito de representação reduzida; *WGBS: sequenciação de bissulfito de genoma inteiro; *BSPP: sondas de cadeado de bissulfito.

Conversão de bissulfito estimulou uma revolução na análise da metilação do genoma nos anos 90. Uma vez que o bissulfito pode converter citosinas não metiladas no genoma em uracílios e depois substituídas por timinas durante a amplificação PCR, que podem ser distinguidas da citosina originalmente modificada pela metilação através da contagem de citosinas e timinas para cada posição após o sequenciamento (Figura 1). O sequenciamento do bissulfito de genoma inteiro (WGBS), como um método de pesquisa de grande significado neste campo, aplica uma combinação de tratamento de bissulfito e tecnologias de sequenciamento de próxima/terceira geração (principalmente, sequenciamento por caçadeira) para estudar a metilação do DNA a nível genômico.

Principles and Workflow of Whole Genome Bisulfite Sequencing

Figure 1. Conversão de bissulfito e amplificação PCR antes da sequência de ADN.

Vantagens da sequência de bissulfito do genoma inteiro

  • Possibilitar o perfil de metilação em todo o genoma a um nível de base única.
  • Avaliar o estado de metilação de quase todos os locus CpG, incluindo “desertos genéticos” intergénicos, domínios de metilação parcial e elementos reguladores remotos.
  • Revelando níveis absolutos de metilação de DNA e fundo de sequência de metilação.

Fluxo de trabalho da sequência de bissulfito do genoma inteiro

Em suma, os passos básicos da sequência de bissulfito do genoma inteiro (WGBS) incluem extração de DNA, conversão de bissulfito, preparação da biblioteca, sequenciamento e análise bioinformática. Aqui usamos Illumina HiSeq como nosso exemplo para ilustrar o fluxo de trabalho do WGBS.

Principles and Workflow of Whole Genome Bisulfite Sequencing

Figure 2. O fluxo de trabalho da sequência de bissulfito do genoma inteiro (Khanna et al. 2013).

  • Exploração de DNA

Primeiro, aproximadamente 1-5 mg de amostras de tecido coletadas de humanos, animais, plantas ou microorganismos são preparados para DNA. Em geral, as amostras para sequenciamento de bissulfito de genoma inteiro precisam satisfazer as seguintes quatro características.

i. Eukaryotes;

ii. Hipometilação (como mostrado na Figura 3, estudos mostraram que uma vez que o número de locais CpG em uma região aumenta, os dados de seqüenciamento de WGBS começam a diminuir);

iii. Seu genoma de referência foi montado ao nível do andaime pelo menos;

iv. Anotações relativamente completas do genoma. E então, aplique um kit adequado para extrair DNA de alta pureza e alto peso molecular. O DNA extraído deve ter uma massa não inferior a 5 μg, uma concentração não inferior a 50 ng/ul, e um OD260/280 de 1.8 a 2.0.

Principles and Workflow of Whole Genome Bisulfite Sequencing

Figure 3. A tecnologia convencional WGBS tem baixa cobertura de locais de metilação (Raine et al. 2016)

  • Conversão de Bissulfito

Conversão de Bissulfito é considerada o “padrão ouro” para análise de metilação de DNA, os princípios foram mostrados na Figura 4. Para este método, a degradação do DNA induzida pela BS pode levar ao esgotamento de regiões genômicas enriquecidas por citosinas não metiladas. Portanto, é importante avaliar a quantidade de degradação do DNA sob condições de reação, e como isso afeta o amplicon desejado também deve ser considerado. Olova et al. (2018) descobriram que a degradação do DNA é forte em protocolos de conversão de bissulfito que utilizam alta desnaturação ou alta molaridade de bissulfito. Há vários kits disponíveis no mercado (Tabela 2).

Principles and Workflow of Whole Genome Bisulfite Sequencing

Figure 4. Desaminação mediada por bissulfito de citosina (Hayatsu et al. 2004).

Tabela 2. Protocolos e parâmetros de conversão de bissulfito.

Digestão enzimática

Enriquecimento por afinidade

Bissulfito de sódio

>>

Princípios

algumas enzimas de restrição, tais como HpaII e SmaI, são inibidos por 5meC no CpG. Affinity enrichment usa anticorpos específicos para 5meC ou proteínas de ligação a metilo com afinidade para perfil de metilação do DNA. Bissulfito de sódio transforma quimicamente citosina não metilada em uracil, permitindo assim a detecção da metilação.
>

Exemplo do método

Metil-seq

*MCA-seq

*HELP-seq

*MSCC

*MeDIP-seq

*MIRA-seq

*RRRBS

*WGBS

*BSPP

Kits Denaturação Temperatura de conversão Tempo de incubação
Zymo EZ DNA Methylation Lightning Kit Baseado em calor; 99 °C
Base alcalina; 37 °C
65 °C 90 minutos
Kit de Metilação de ADN EZ (Qiagen) Baseado em calor; 99 °C 55 °C 10 horas
Kit de Metilação de ADN EZ (Zymo Research) Base alcalina; 37 °C 50 °C 12-16 horas
  • Preparação da biblioteca

Toma o Kit EpiGnomeTM Metil-Seq (Epicentro) como exemplo (como mostrado na Figura 5), O DNA de cadeia única tratado com bissulfito é impregnado com uma polimerase capaz de ler nucleotídeos uracilais, para sintetizar o DNA contendo uma etiqueta de sequência específica. A extremidade de 3′ da cadeia de DNA recém-sintetizada é então etiquetada selectivamente com uma segunda sequência específica, assim é possível obter uma molécula de DNA de dois marcadores com uma etiqueta de sequência conhecida nas extremidades de 5′ e 3′. Os adaptadores Illumina P7 e P5 são subsequentemente adicionados por PCR nas extremidades 5 e 3 antes da sequência de ADN.

Principles and Workflow of Whole Genome Bisulfite Sequencing

Figure 5. Workflow para o EpiGnomeTM Methyl-Seq Kit.

  • Sequenciação

Tecnologia de sequenciação Hiseq, um novo método de sequenciação baseado em sequenciação por síntese (SBS), é amplamente aplicado para o WGBS. A amplificação da ponte em uma célula de fluxo é obtida usando uma única matriz de moléculas. Como a nova técnica de bloqueio reversível pode sintetizar apenas uma base de cada vez e rotular o fluoróforo, o laser correspondente é usado para excitar o fluoróforo, e a luz de excitação pode ser capturada para ler a informação da base. A estratégia Paired-end 150 bp é tipicamente empregada no WGBS para seqüenciar bibliotecas de DNA tratadas com bissulfito 250-300 bp. Além de Illumina HiSeq, PacBio SMRT, Nanopore, Roche 454, e outras plataformas Illumina também são comumente usadas para este propósito.

  • Análise de dados

Uma série de análises pode ser realizada para os resultados da sequência. Cinco tipos principais de análises de informação estão listados na Tabela 3. Além disso, também podem ser realizadas análises de densidade de metilação, análise de região diferencialmente metilada (DMR), anotação de DMR e análise de enriquecimento (GO/KEGG) e análise de agrupamento. Os recursos bioinformáticos comuns do WGBS incluem BDPC, CpGcluster, CpGFinder, Epinexus, MethTools, mPod, QUMA, e TCGA Data Portal.

Table 3. Principais tipos de análise de dados WGBS.

Serviços característicos:

Sequenciação de bissulfito de todo o genoma

Sequenciação de bissulfito alvo

ChIP-seq

Sequenciação de bissulfito de Representação Reduzida

  1. Fraga, M. F., Esteller, M. (2002). Metilação de DNA: um perfil de métodos e aplicações. Biotechniques, 33(3), 636-49.
  2. Green, R. E., Krause, J., Briggs, A. W., Maricic, T., Stenzel, U., et al. (2010). A Draft Sequence of the Neandertal Genome (Uma Sequência de Rascunho do Genoma Neandertal). Science, 328(5979), 710-722.
  3. Hayatsu, H., Negishi, K., & Shiraishi, M. (2004). Análise da metilação do DNA: aceleração da desaminação mediada por bissulfito de citosina no procedimento de seqüenciamento genômico. Proceedings of the Japan Academy,80(4), 189-194.
  4. Herman, J. G., Graff, J. R., Myöhänen, S., Nelkin, B. D., & Baylin, S. B. (1996). Methylation-specific pcr: a novel pcr assay for methylation status of cpg islands. Proceedings of the National Academy of Sciences of the United States of America, 93(18), 9821-9826.
  5. Ji, L., Sasaki, T., Sun, X., Ma, P., Lewis, Z. A., & Schmitz, R. J. (2014). O DNA metilado está sobre-representado em dados de sequência de bissulfito de genoma inteiro. Front Genet, 5(5), 341.
  6. Khanna, A., Czyz, A., & Syed, F. (2013). Epignome methyl-seq kit: um novo método de preparação da biblioteca de conversão pós-bissulfito para análise da metilação. Nature Methods, 10(10).
  7. Laird, P. W. (2003). O poder e a promessa dos marcadores de metilação de DNA. Nature Reviews Cancer, 3(4), 253-266. doi:10.1038/nrc1045
  8. Laura-Jayne, G., Mark, Q. T., Lisa, O., Jonathan, P., Neil, H., & Anthony, H. (2015). Um levantamento genômico da metilação do DNA no trigo hexaplóide. Genome Biology, 16(1), 273.
  9. Lin Liu, Ni Hu, Bo Wang, Minfeng Chen, Juan Wang, & Zhijian Tian, et al. (2011). Um breve relatório de utilização sobre o sequenciador illumina hiseq 2000. Mycology, 2(3), 169-191.
  10. Meissner, A., Gnirke, A., Bell, G. W., Ramsahoye, B., Lander, E. S., & Jaenisch, R. (2005). Redução da sequência de bissulfitos de representação para análise comparativa de alta resolução da metilação do DNA. Nucleic Acids Research, 33(18), 5868-77.
  11. Meyer, M., Kircher, M., Gansauge, M. T., Li, H., Racimo, F., & Mallick, S., et al. (2012). Uma seqüência de genoma de alta cobertura de um indivíduo denisovano arcaico. Science, 338(6104), 222-6.
  12. Olova, N., Krueger, F., Andrews, S., Oxley, D., Berrens, R. V., & Branco, M. R., et al. (2018). Comparação de estratégias de preparação de biblioteca de seqüenciamento de bissulfito de genoma inteiro identifica fontes de vieses que afetam os dados de metilação de DNA. Genome Biology, 19(1), 33.
  13. Raine, A., Manlig, E., Wahlberg, P., Syvänen, A. C., & Nordlund, J. (2016). Splinted ligation adapter tagging (splat), um novo método de preparação de biblioteca para seqüenciamento de bissulfito de genoma inteiro. Nucleic Acids Research, 45(6), e36.
  14. Ziller, M. J., Müller, F., Liao, J., Zhang, Y., Gu, H., & Bock, C., et al. (2011). Distribuição genómica e variação entre amostras da metilação não-pg através de tipos de células humanas. Plos Genetics, 7(12), e1002389.
* Apenas para uso em pesquisa. Não para uso em procedimentos diagnósticos.
Type Detalhes
Alinhamento contra o genoma de referência Ferramentas, como software SOAP, são usadas para comparar as leituras com a sequência do genoma de referência, e apenas as leituras alinhadas serão usadas para a análise da informação da metilação. Leituras alinhadas permitindo combinações C-C e desajustes C-T.
mC chamando Determinar a posição mC ao longo do genoma. As razões mC são calculadas considerando as probabilidades de qualidade de leitura e mapeamento multi-locus. Descarte o alinhamento de pequenas probabilidades que tem uma baixa confiabilidade de alinhamento.
Análise de profundidade e cobertura de sequência Uma imagem que reflete a relação entre a cobertura do gene e a profundidade de sequência determina se a descoberta da metilação pode ser feita com um certo grau de confiança em posições de base específicas.
Análise do nível de metilação O nível de metilação de cada base C metilada é calculado da seguinte forma 100*leitura/total de leituras. O nível médio de metilação do genoma reflete as características gerais do perfil genômico de metilação.
Tendências globais do metiloma A razão de distribuição de CG, CHGG e CHH em bases C metiladas reflete as características de mapas de metilação do genoma inteiro de espécies específicas até certo ponto.