Articles

Principes et flux de travail du séquençage au bisulfite du génome entier

Principes du séquençage au bisulfite du génome entier

Les études épigénétiques ont confirmé que la modification par méthylation de l’ADN de régions génétiques spécifiques joue un rôle important dans la conformation du chromosome et la régulation de l’expression génique. La méthylation des résidus cytosine de l’ADN au niveau du C5 (5meC) est une marque épigénétique commune à de nombreux eucaryotes et se retrouve largement dans les CpG ou CpHpG (H=A, T, C). Il existe principalement trois approches, dont la digestion par endonucléase, l’enrichissement par affinité et la conversion au bisulfite (tableau 1). Presque toutes les approches d’analyse de la méthylation de l’ADN spécifiques à une séquence nécessitent un traitement dépendant de la méthylation avant l’amplification ou l’hybridation afin de maintenir la fidélité. Diverses techniques de biologie moléculaire, telles que le séquençage de nouvelle génération (NGS), sont ensuite réalisées pour détecter les résidus 5meC.

Tableau 1. Grands principes de l’analyse de la méthylation basée sur le NGS.

Digestion enzymatique

Enrichissement par affinité

Bisulfite de sodium

Principes

Certaines enzymes de restriction, telles que HpaII et SmaI, sont inhibées par le 5meC dans le CpG. L’enrichissement par affinité utilise des anticorps spécifiques du 5meC ou des protéines de liaison au méthyle avec affinité pour le profilage de la méthylation de l’ADN. Le bisulfite de sodium transforme chimiquement la cytosine non méthylée en uracile, permettant ainsi la détection de la méthylation.

Exemple de méthode

Méthyl-seq

*MCA-seq

*HELP-seq

*MSCC

*MeDIP-seq

*MIRA-seq

*RRBS

*WGBS

*BSPP

*MCA : Amplification des îlots CpG méthylés ; *HELP : HpaII tiny fragment enrichment by ligation-mediated PCR ; *MSCC : methylation-sensitive cut counting ; *MeDIP-seq : methylated DNA immunoprecipitation ; *MIRA : methylated CpG island recovery assay ; *RRBS : reduced representation bisulfite sequencing ; *WGBS : whole genome bisulfite sequencing ; *BSPP : bisulfite padlock probes.

La conversion au bisulfite a suscité une révolution dans l’analyse de la méthylation du génome dans les années 1990. Puisque le bisulfite peut convertir les cytosines non méthylées du génome en uraciles et ensuite remplacées par des thymines pendant l’amplification par PCR, qui peuvent être distinguées de la cytosine initialement modifiée par méthylation en comptant les cytosines et les thymines pour chaque position après le séquençage (Figure 1). Le séquençage au bisulfite du génome entier (WGBS), en tant que méthode de recherche de grande importance dans ce domaine, applique une combinaison de traitement au bisulfite et de technologies de séquençage de nouvelle/troisième génération (principalement, le séquençage shotgun) pour étudier la méthylation de l’ADN au niveau génomique.

Principles and Workflow of Whole Genome Bisulfite Sequencing

Figure 1. Conversion au bisulfite et amplification PCR avant le séquençage de l’ADN.

Avantages du séquençage au bisulfite du génome entier

  • Rendant possible le profilage de la méthylation à l’échelle du génome au niveau d’une seule base.
  • Évaluer le statut de méthylation de presque tous les locus CpG, y compris les « déserts géniques » intergéniques, les domaines de méthylation partielle et les éléments régulateurs distants.
  • Révéler les niveaux absolus de méthylation de l’ADN et le fond de séquence de méthylation.

Flux de travail du séquençage au bisulfite du génome entier

En bref, les étapes de base du séquençage au bisulfite du génome entier (WGBS) comprennent l’extraction de l’ADN, la conversion au bisulfite, la préparation de la bibliothèque, le séquençage et l’analyse bioinformatique. Ici, nous utilisons Illumina HiSeq comme notre exemple pour illustrer le flux de travail du WGBS.

Principles and Workflow of Whole Genome Bisulfite Sequencing

Figure 2. Le flux de travail du séquençage au bisulfite du génome entier (Khanna et al. 2013).

  • Extraction de l’ADN

En premier lieu, environ 1 à 5 mg d’échantillons de tissus prélevés sur des humains, des animaux, des plantes ou des micro-organismes sont préparés pour l’ADN. En général, les échantillons pour le séquençage au bisulfite du génome entier doivent répondre aux quatre caractéristiques suivantes.

i. Eucaryotes;

ii. Hypométhylation (comme le montre la figure 3, des études ont montré qu’une fois que le nombre de sites CpG dans une région augmente, les données de séquençage du WGBS commencent à diminuer);

iii. Son génome de référence a été assemblé au moins au niveau de l’échafaudage;

iv. Annotations du génome relativement complètes. Et ensuite, appliquer un kit approprié pour extraire un ADN de haute pureté et de haut poids moléculaire. L’ADN extrait doit avoir une masse de pas moins de 5 μg, une concentration de pas moins de 50 ng/ul, et une OD260/280 de 1,8 à 2,0.

Principles and Workflow of Whole Genome Bisulfite Sequencing

Figure 3. La technologie conventionnelle de la BSG a une faible couverture des sites de méthylation (Raine et al. 2016)

  • Conversion au bisulfite

La conversion au bisulfite est considérée comme le « gold standard » pour l’analyse de la méthylation de l’ADN, les principes ont été montrés dans la Figure 4. Pour cette méthode, la dégradation de l’ADN induite par la BS peut conduire à l’appauvrissement des régions génomiques enrichies en cytosines non méthylées. Par conséquent, il est important d’évaluer la quantité de dégradation de l’ADN dans les conditions de réaction, et la façon dont cela affecte l’amplicon souhaité doit également être prise en compte. Olova et al. (2018) ont constaté que la dégradation de l’ADN est forte dans les protocoles de conversion au bisulfite qui utilisent une dénaturation élevée ou une molarité élevée du bisulfite. Il existe plusieurs kits disponibles sur le marché (tableau 2).

Principles and Workflow of Whole Genome Bisulfite Sequencing

Figure 4. Désamination de la cytosine médiée par le bisulfite (Hayatsu et al. 2004).

Tableau 2. Protocoles et paramètres de conversion au bisulfite.

Kits Dénaturation Température de conversion Temps d’incubation
Zymo EZ DNA Methylation Lightning Kit Base de chaleur ; 99 °C
Base alcaline ; 37 °C
65 °C 90 minutes
Kit Bisulfite EpiTect (Qiagen) Base de chaleur ; 99 °C 55 °C 10 heures
Kit de méthylation de l’ADN EZ (Zymo Research) Base alcaline ; 37 °C 50 °C 12-16 heures
  • Préparation de la bibliothèque

Prenez le kit EpiGnomeTM Methyl-Seq (Epicentre) comme exemple (comme indiqué dans la figure 5), L’ADN simple brin traité au bisulfite est amorcé de manière aléatoire à l’aide d’une polymérase capable de lire les nucléotides d’uracile, afin de synthétiser un ADN contenant une étiquette de séquence spécifique. L’extrémité 3′ du brin d’ADN nouvellement synthétisé est ensuite marquée sélectivement avec une seconde séquence spécifique, ce qui permet d’obtenir un ADN moléculaire à deux marqueurs avec une séquence connue aux extrémités 5′ et 3′. Les adaptateurs Illumina P7 et P5 sont ensuite ajoutés par PCR aux extrémités 5 et 3 avant le séquençage de l’ADN.

Principles and Workflow of Whole Genome Bisulfite Sequencing

Figure 5. Flux de travail pour le kit EpiGnomeTM Methyl-Seq.

  • Séquençage

La technologie de séquençage Hiseq, une nouvelle méthode de séquençage basée sur le séquençage par synthèse (SBS), est largement appliquée pour le WGBS. L’amplification en pont sur une cellule à flux est réalisée en utilisant un réseau de molécules uniques. Comme la nouvelle technique de blocage réversible ne peut synthétiser qu’une seule base à la fois et marquer le fluorophore, le laser correspondant est utilisé pour exciter le fluorophore, et la lumière d’excitation peut être capturée pour lire les informations de la base. La stratégie Paired-end 150 pb est généralement employée dans le cadre du WGBS pour séquencer des bibliothèques d’ADN traitées au bisulfite par insertion de 250 à 300 pb. Outre Illumina HiSeq, PacBio SMRT, Nanopore, Roche 454 et d’autres plateformes Illumina sont également couramment utilisées à cette fin.

  • Analyse des données

Une série d’analyses peut être effectuée pour les résultats du séquençage. Cinq principaux types d’analyse de l’information sont énumérés dans le tableau 3. En outre, l’analyse de la densité de méthylation, l’analyse des régions différentiellement méthylées (DMR), l’analyse de l’annotation et de l’enrichissement des DMR (GO/KEGG) et l’analyse de regroupement peuvent également être effectuées. Les ressources bioinformatiques communes du WGBS comprennent BDPC, CpGcluster, CpGFinder, Epinexus, MethTools, mPod, QUMA et TCGA Data Portal.

Tableau 3. Principaux types d’analyse des données WGBS.

Type Détails
Alignement contre le génome de référence Des outils, tels que le logiciel SOAP, sont utilisés pour comparer les lectures avec la séquence du génome de référence, et seules les lectures alignées seront utilisées pour l’analyse des informations de méthylation. Aligner les lectures permettant les correspondances C-C et les mésappariements C-T.
mC calling Déterminer la position des mC dans tout le génome. Les rapports mC sont calculés en tenant compte de la qualité des lectures et des probabilités de cartographie multi-locus. Écarter les alignements à faible probabilité qui ont une faible fiabilité d’alignement.
Analyse de la profondeur et de la couverture de la séquence Une image reflétant la relation entre la couverture du gène et la profondeur de séquençage détermine si la découverte de méthylation peut être faite avec un certain degré de confiance à des positions de base spécifiques.
Analyse du niveau de méthylation Le niveau de méthylation de chaque base C méthylée est calculé comme suit : 100*lectures/total des lectures. Le niveau de méthylation moyen à l’échelle du génome reflète les caractéristiques générales du profil de méthylation génomique.
Tendances globales du méthylome Le rapport de distribution de CG, CHGG et CHH dans les bases C méthylées reflète dans une certaine mesure les caractéristiques des cartes de méthylation du génome entier d’espèces spécifiques.

Services vedettes:

Séquençage au bisulfite du génome entier

Séquençage au bisulfite ciblé

ChIP-seq

Séquençage au bisulfite à représentation réduite

  1. Fraga, M. F., Esteller, M. (2002). La méthylation de l’adn : un profil des méthodes et des applications. Biotechniques, 33(3), 636-49.
  2. Green, R. E., Krause, J., Briggs, A. W., Maricic, T., Stenzel, U., et al. (2010). A Draft Sequence of the Neandertal Genome. Science, 328(5979), 710-722.
  3. Hayatsu, H., Negishi, K., & Shiraishi, M. (2004). Analyse de la méthylation de l’ADN : accélération de la désamination de la cytosine médiée par le bisulfite dans la procédure de séquençage génomique. Proceedings of the Japan Academy,80(4), 189-194.
  4. Herman, J. G., Graff, J. R., Myöhänen, S., Nelkin, B. D., & Baylin, S. B. (1996). Methylation-specific pcr : a novel pcr assay for methylation status of cpg islands. Proceedings of the National Academy of Sciences of the United States of America, 93(18), 9821-9826.
  5. Ji, L., Sasaki, T., Sun, X., Ma, P., Lewis, Z. A., & Schmitz, R. J. (2014). L’adn méthylé est surreprésenté dans les données de séquençage au bisulfite du génome entier. Front Genet, 5(5), 341.
  6. Khanna, A., Czyz, A., & Syed, F. (2013). Kit Epignome methyl-seq : une nouvelle méthode de préparation de bibliothèque après conversion au bisulfite pour l’analyse de la méthylation. Nature Methods, 10(10).
  7. Laird, P. W. (2003). Le pouvoir et la promesse des marqueurs de méthylation de l’ADN. Nature Reviews Cancer, 3(4), 253-266. doi:10.1038/nrc1045
  8. Laura-Jayne, G., Mark, Q. T., Lisa, O., Jonathan, P., Neil, H., & Anthony, H. (2015). Une enquête à l’échelle du génome de la méthylation de l’adn dans le blé hexaploïde. Genome Biology, 16(1), 273.
  9. Lin Liu, Ni Hu, Bo Wang, Minfeng Chen, Juan Wang, & Zhijian Tian, et al. (2011). Un bref rapport d’utilisation sur le séquenceur illumina hiseq 2000. Mycologie, 2(3), 169-191.
  10. Meissner, A., Gnirke, A., Bell, G. W., Ramsahoye, B., Lander, E. S., & Jaenisch, R. (2005). Séquençage bisulfite à représentation réduite pour l’analyse comparative à haute résolution de la méthylation de l’adn. Nucleic Acids Research, 33(18), 5868-77.
  11. Meyer, M., Kircher, M., Gansauge, M. T., Li, H., Racimo, F., & Mallick, S., et al. (2012). Une séquence génomique à haute couverture d’un individu denisovan archaïque. Science, 338(6104), 222-6.
  12. Olova, N., Krueger, F., Andrews, S., Oxley, D., Berrens, R. V., & Branco, M. R., et al. (2018). La comparaison des stratégies de préparation des bibliothèques de séquençage au bisulfite du génome entier identifie les sources de biais affectant les données de méthylation de l’adn. Genome Biology, 19(1), 33.
  13. Raine, A., Manlig, E., Wahlberg, P., Syvänen, A. C., & Nordlund, J. (2016). Splinted ligation adapter tagging (splat), une nouvelle méthode de préparation de bibliothèque pour le séquençage bisulfite du génome entier. Nucleic Acids Research, 45(6), e36.
  14. Ziller, M. J., Müller, F., Liao, J., Zhang, Y., Gu, H., & Bock, C., et al. (2011). Distribution génomique et variation inter-échantillon de la méthylation non-cpg à travers les types de cellules humaines. Plos Genetics, 7(12), e1002389.
* Réservé à la recherche. Ne pas utiliser dans les procédures de diagnostic.