Articles

Principles and Workflow of Whole Genome Bisulfite Sequencing

Principles of whole genome bisulfite sequencing

Epigenetische Studien haben bestätigt, dass die DNA-Methylierungsmodifikation bestimmter Genregionen eine wichtige Rolle bei der Chromosomenkonformation und der Regulierung der Genexpression spielt. Die Methylierung von DNA-Cytosinresten am C5 (5meC) ist eine häufige epigenetische Markierung in vielen Eukaryonten und kommt häufig in CpG oder CpHpG (H=A, T, C) vor. Es gibt hauptsächlich drei Ansätze, darunter Endonuklease-Verdau, Affinitätsanreicherung und Bisulfit-Umwandlung (Tabelle 1). Fast alle sequenzspezifischen DNA-Methylierungsanalyseverfahren erfordern eine methylierungsabhängige Behandlung vor der Amplifikation oder Hybridisierung, um die Zuverlässigkeit zu gewährleisten. Anschließend werden verschiedene molekularbiologische Techniken wie die Sequenzierung der nächsten Generation (NGS) durchgeführt, um 5meC-Reste nachzuweisen.

Tabelle 1. Hauptprinzipien der NGS-basierten Methylierungsanalyse.

Enzymverdau

Affinitätsanreicherung

Natriumbisulfit

Prinzipien

Einige Restriktionsenzyme, wie HpaII und SmaI, werden durch 5meC im CpG gehemmt. Die Affinitätsanreicherung verwendet Antikörper, die spezifisch für 5meC sind, oder methylbindende Proteine mit Affinität für die Erstellung von DNA-Methylierungsprofilen. Natriumbisulfit wandelt unmethyliertes Cytosin chemisch in Uracil um und ermöglicht so den Methylierungsnachweis.

Methodenbeispiel

Methyl-seq

*MCA-seq

*HELP-seq

*MSCC

*MeDIP-seq

*MIRA-seq

*RRBS

*WGBS

*BSPP

*MCA: Methylated CpG Island Amplification; *HELP: HpaII tiny fragment enrichment by ligation-mediated PCR; *MSCC: methylation-sensitive cut counting; *MeDIP-seq: methylated DNA immunoprecipitation; *MIRA: methylated CpG island recovery assay; *RRBS: reduced representation bisulfite sequencing; *WGBS: whole genome bisulfite sequencing; *BSPP: bisulfite padlock probes.

Die Bisulfit-Umwandlung löste in den 1990er Jahren eine Revolution in der Methylierungsanalyse des Genoms aus. Da Bisulfit unmethylierte Cytosine im Genom in Uracil umwandeln kann, die dann während der PCR-Amplifikation durch Thymin ersetzt werden, können diese von den ursprünglich durch Methylierung modifizierten Cytosinen unterschieden werden, indem Cytosine und Thymine für jede Position nach der Sequenzierung gezählt werden (Abbildung 1). Die Ganzgenom-Bisulfit-Sequenzierung (WGBS), eine Forschungsmethode von großer Bedeutung auf diesem Gebiet, wendet eine Kombination aus Bisulfit-Behandlung und Sequenzierungstechnologien der nächsten/dritten Generation (meist Shotgun-Sequenzierung) an, um die DNA-Methylierung auf genomischer Ebene zu untersuchen.

Principles and Workflow of Whole Genome Bisulfite Sequencing

Abbildung 1. Bisulfit-Konvertierung und PCR-Amplifikation vor der DNA-Sequenzierung.

Vorteile der Ganzgenom-Bisulfit-Sequenzierung

  • Ermöglicht genomweite Methylierungsprofile auf Einzelbasenebene.
  • Messung des Methylierungsstatus fast aller CpG-Loci, einschließlich intergenischer „Genwüsten“, partieller Methylierungsdomänen und entfernter regulatorischer Elemente.
  • Aufdeckung der absoluten DNA-Methylierungsgrade und des Methylierungssequenzhintergrunds

Arbeitsablauf der Ganzgenom-Bisulfit-Sequenzierung

Kurz gesagt, umfassen die grundlegenden Schritte der Ganzgenom-Bisulfit-Sequenzierung (WGBS) die DNA-Extraktion, die Bisulfit-Konvertierung, die Bibliotheksvorbereitung, die Sequenzierung und die bioinformatische Analyse. Hier verwenden wir Illumina HiSeq als Beispiel, um den Arbeitsablauf der WGBS zu veranschaulichen.

Principles and Workflow of Whole Genome Bisulfite Sequencing

Abbildung 2. Der Arbeitsablauf der Ganzgenom-Bisulfit-Sequenzierung (Khanna et al. 2013).

  • DNA-Extraktion

Zunächst werden ca. 1-5 mg Gewebeproben, die von Menschen, Tieren, Pflanzen oder Mikroorganismen gesammelt wurden, für die DNA aufbereitet. Im Allgemeinen müssen die Proben für die Ganzgenom-Bisulfit-Sequenzierung die folgenden vier Merkmale erfüllen:

i. Eukaryoten;

ii. Hypomethylierung (wie in Abbildung 3 dargestellt, haben Studien gezeigt, dass die Sequenzierdaten von WGBS abzunehmen beginnen, sobald die Anzahl der CpG-Stellen in einer Region zunimmt);

iii. Das Referenzgenom wurde mindestens bis zur Gerüstebene assembliert;

iv. Relativ vollständige Genomannotationen. Anschließend wird ein geeignetes Kit zur Extraktion hochreiner und hochmolekularer DNA verwendet. Die extrahierte DNA sollte eine Masse von nicht weniger als 5 μg, eine Konzentration von nicht weniger als 50 ng/ul und eine OD260/280 von 1,8 bis 2,0 aufweisen.

Principles and Workflow of Whole Genome Bisulfite Sequencing

Abbildung 3. Die herkömmliche WGBS-Technologie hat eine geringe Abdeckung der Methylierungsstellen (Raine et al. 2016)

  • Bisulfit-Konvertierung

Die Isulfit-Konvertierung gilt als „Goldstandard“ für die DNA-Methylierungsanalyse, die Prinzipien sind in Abbildung 4 dargestellt. Bei dieser Methode kann der BS-induzierte DNA-Abbau zu einer Verarmung von genomischen Regionen führen, die mit unmethylierten Cytosinen angereichert sind. Daher ist es wichtig, das Ausmaß des DNA-Abbaus unter den Reaktionsbedingungen zu bewerten, und es sollte auch berücksichtigt werden, wie sich dies auf das gewünschte Amplikon auswirkt. Olova et al. (2018) fanden heraus, dass der DNA-Abbau bei Bisulfit-Konversionsprotokollen, die eine hohe Denaturierung oder eine hohe Bisulfit-Molarität verwenden, stark ist. Es sind mehrere Kits auf dem Markt erhältlich (Tabelle 2).

Principles and Workflow of Whole Genome Bisulfite Sequencing

Abbildung 4. Bisulfit-vermittelte Desaminierung von Cytosin (Hayatsu et al. 2004).

Tabelle 2. Protokolle und Parameter der Bisulfitumwandlung.

Kits Denaturierung Konvertierungstemperatur Inkubationszeit
Zymo EZ DNA Methylation Lightning Kit Wärme-basiert; 99 °C
Alkaline-basiert; 37 °C
65 °C 90 Minuten
EpiTect Bisulfite Kit (Qiagen) Wärmebasiert; 99 °C 55 °C 10 Stunden
EZ DNA Methylation Kit (Zymo Research) Alkaline-basiert; 37 °C 50 °C 12-16 Stunden
  • Bibliotheksvorbereitung

Beispielhaft sei hier das EpiGnomeTM Methyl-Seq Kit (Epicentre) genannt (wie in Abbildung 5 dargestellt), Bisulfit-behandelte einzelsträngige DNA wird mit einer Polymerase, die Uracil-Nukleotide lesen kann, random-primed, um DNA zu synthetisieren, die eine spezifische Sequenzmarkierung enthält. Das 3′-Ende des neu synthetisierten DNA-Strangs wird dann selektiv mit einer zweiten spezifischen Sequenz markiert, so dass ein DNA-Molekül mit zwei Markern mit einer bekannten Sequenzmarkierung am 5′- und 3′-Ende erhalten werden kann. Die Illumina P7- und P5-Adapter werden anschließend vor der DNA-Sequenzierung durch PCR am 5′- und 3′-Ende hinzugefügt.

Principles and Workflow of Whole Genome Bisulfite Sequencing

Abbildung 5. Arbeitsablauf für das EpiGnomeTM Methyl-Seq Kit.

  • Sequenzierung

Die Hiseq-Sequenzierungstechnologie, eine neuartige Sequenzierungsmethode, die auf Sequenzierung durch Synthese (SBS) basiert, wird häufig für WGBS eingesetzt. Die Brückenamplifikation auf einer Durchflusszelle wird durch die Verwendung eines Einzelmolekül-Arrays erreicht. Da mit der neuen reversiblen Blockierungstechnik jeweils nur eine Base synthetisiert und das Fluorophor markiert werden kann, wird der entsprechende Laser zur Anregung des Fluorophors verwendet, und das Anregungslicht kann zum Auslesen der Baseninformation eingefangen werden. Die Paired-End-Strategie (150 bp) wird in der Regel bei WGBS eingesetzt, um 250-300 bp-Insertions-Bisulfit-behandelte DNA-Bibliotheken zu sequenzieren. Neben Illumina HiSeq werden auch PacBio SMRT, Nanopore, Roche 454 und andere Illumina-Plattformen für diesen Zweck verwendet.

  • Datenanalyse

Eine Reihe von Analysen kann für die Sequenzierergebnisse durchgeführt werden. Die fünf wichtigsten Arten der Informationsanalyse sind in Tabelle 3 aufgeführt. Darüber hinaus können eine Analyse der Methylierungsdichte, eine Analyse der differenziell methylierten Regionen (DMR), eine DMR-Annotation und eine Anreicherungsanalyse (GO/KEGG) sowie eine Clustering-Analyse durchgeführt werden. Zu den gängigen bioinformatischen Ressourcen von WGBS gehören BDPC, CpGcluster, CpGFinder, Epinexus, MethTools, mPod, QUMA und TCGA Data Portal.

Tabelle 3. Haupttypen der WGBS-Datenanalyse.

Typ Details
Abgleich mit dem Referenzgenom Tools wie SOAP-Software werden verwendet, um die Reads mit der Referenzgenomsequenz zu vergleichen, und nur die abgeglichenen Reads werden für die Analyse der Methylierungsinformationen verwendet. Alignment von Reads unter Berücksichtigung von C-C-Matches und C-T-Mismatches.
mC-Calling Bestimmen Sie die mC-Position im gesamten Genom. mC-Verhältnisse werden unter Berücksichtigung der Lesequalität und der Multi-Locus-Mapping-Wahrscheinlichkeit berechnet. Verwerfen Sie Alignments mit geringer Wahrscheinlichkeit, die eine geringe Zuverlässigkeit des Alignments aufweisen.
Analyse der Sequenztiefe und -abdeckung Ein Bild, das das Verhältnis zwischen Genabdeckung und Sequenzierungstiefe widerspiegelt, bestimmt, ob Methylierungsentdeckungen mit einem gewissen Grad an Sicherheit an bestimmten Basenpositionen gemacht werden können.
Analyse des Methylierungsgrads Der Methylierungsgrad jeder methylierten C-Base wird wie folgt berechnet: 100*Leseproben/Gesamtleseproben. Der genomweite durchschnittliche Methylierungsgrad spiegelt die allgemeinen Merkmale des genomischen Methylierungsprofils wider.
Globale Trends des Methyloms Das Verteilungsverhältnis von CG, CHGG und CHH in den methylierten C-Basen spiegelt bis zu einem gewissen Grad die Merkmale der Methylierungskarten des gesamten Genoms bestimmter Arten wider.

Dienstleistungen:

Ganzgenom-Bisulfit-Sequenzierung

Gezielte Bisulfit-Sequenzierung

ChIP-seq

Reduced Representation Bisulfite Sequencing

  1. Fraga, M. F., Esteller, M. (2002). Dna-Methylierung: ein Profil von Methoden und Anwendungen. Biotechniques, 33(3), 636-49.
  2. Green, R. E., Krause, J., Briggs, A. W., Maricic, T., Stenzel, U., et al. (2010). A Draft Sequence of the Neandertal Genome. Science, 328(5979), 710-722.
  3. Hayatsu, H., Negishi, K., & Shiraishi, M. (2004). DNA-Methylierungsanalyse: Beschleunigung der Bisulfit-vermittelten Desaminierung von Cytosin im genomischen Sequenzierungsverfahren. Proceedings of the Japan Academy,80(4), 189-194.
  4. Herman, J. G., Graff, J. R., Myöhänen, S., Nelkin, B. D., & Baylin, S. B. (1996). Methylierungsspezifische pcr: ein neuer pcr-Assay für den Methylierungsstatus von cpg-Inseln. Proceedings of the National Academy of Sciences of the United States of America, 93(18), 9821-9826.
  5. Ji, L., Sasaki, T., Sun, X., Ma, P., Lewis, Z. A., & Schmitz, R. J. (2014). Methylated dna is over-represented in whole-genome bisulfite sequencing data. Front Genet, 5(5), 341.
  6. Khanna, A., Czyz, A., & Syed, F. (2013). Epignome methyl-seq kit: a novel post-bisulfite conversion library prep method for methylation analysis. Nature Methods, 10(10).
  7. Laird, P. W. (2003). The power and the promise of DNA methylation markers. Nature Reviews Cancer, 3(4), 253-266. doi:10.1038/nrc1045
  8. Laura-Jayne, G., Mark, Q. T., Lisa, O., Jonathan, P., Neil, H., & Anthony, H. (2015). A genome-wide survey of dna methylation in hexaploid wheat. Genome Biology, 16(1), 273.
  9. Lin Liu, Ni Hu, Bo Wang, Minfeng Chen, Juan Wang, & Zhijian Tian, et al. (2011). Ein kurzer Nutzungsbericht über den Illumina Hiseq 2000 Sequenzer. Mycology, 2(3), 169-191.
  10. Meissner, A., Gnirke, A., Bell, G. W., Ramsahoye, B., Lander, E. S., & Jaenisch, R. (2005). Reduced representation bisulfite sequencing for comparative high-resolution dna methylation analysis. Nucleic Acids Research, 33(18), 5868-77.
  11. Meyer, M., Kircher, M., Gansauge, M. T., Li, H., Racimo, F., & Mallick, S., et al. (2012). A high coverage genome sequence from an archaic denisovan individual. Science, 338(6104), 222-6.
  12. Olova, N., Krueger, F., Andrews, S., Oxley, D., Berrens, R. V., & Branco, M. R., et al. (2018). Comparison of whole-genome bisulfit sequencing library preparation strategies identifies sources of biases affecting dna methylation data. Genome Biology, 19(1), 33.
  13. Raine, A., Manlig, E., Wahlberg, P., Syvänen, A. C., & Nordlund, J. (2016). Splinted ligation adapter tagging (splat), a novel library preparation method for whole genome bisulphite sequencing. Nucleic Acids Research, 45(6), e36.
  14. Ziller, M. J., Müller, F., Liao, J., Zhang, Y., Gu, H., & Bock, C., et al. (2011). Genomic distribution and inter-sample variation of non-cpg methylation across human cell types. Plos Genetics, 7(12), e1002389.
* For Research Use Only. Nicht zur Verwendung in diagnostischen Verfahren.