Articles

Principles and Workflow of Whole Genome Bisulfite Sequencing

Principles of whole genome bisulfite sequencing

Epigenetische studies hebben bevestigd dat DNA-methylering modificatie van specifieke genregio’s een belangrijke rol speelt in chromosoomconformatie en genexpressieregulatie. Methylering van DNA-cytosineresiduen op C5 (5meC) is een veel voorkomende epigenetische markering bij veel eukaryoten en wordt veel aangetroffen in CpG of CpHpG (H=A, T, C). Er zijn hoofdzakelijk drie benaderingen, waaronder endonuclease-digestie, affiniteitsverrijking en bisulfietconversie (tabel 1). Bijna alle sequentiespecifieke DNA-methyleringsanalyses vereisen een methyleringsafhankelijke behandeling vóór de amplificatie of hybridisatie om de getrouwheid te behouden. Verschillende moleculair biologische technieken, zoals next-generation sequencing (NGS), worden vervolgens uitgevoerd om 5meC-residuen te detecteren.

Tabel 1. Belangrijkste principes van op NGS gebaseerde methyleringsanalyse.

Enzymatische digestie

Affiniteitsverrijking

Natriumbisulfiet

Principes

Sommige restrictie-enzymen, zoals HpaII en SmaI, worden geremd door 5meC in het CpG. Affiniteitsverrijking maakt gebruik van antilichamen die specifiek zijn voor 5meC of methylbindende eiwitten met affiniteit voor het profileren van DNA-methylering. Natriumbisulfiet zet chemisch ongemethyleerd cytosine om in uracil, waardoor methylering kan worden opgespoord.

Methodevoorbeeld

Methyl-seq

*MCA-seq

*HELP-seq

*MSCC

*MeDIP-seq

*MIRA-seq

*RRBS

*WGBS

*BSPP

*MCA: Gemethyleerd CpG-eiland amplificatie; *HELP: HpaII tiny fragment enrichment by ligation-mediated PCR; *MSCC: methylation-sensitive cut counting; *MeDIP-seq: methylated DNA immunoprecipitation; *MIRA: methylated CpG island recovery assay; *RRBS: reduced representation bisulfite sequencing; *WGBS: whole genome bisulfite sequencing; *BSPP: bisulfite padlock probes.

Bisulfietconversie leidde in de jaren negentig tot een revolutie in de genoommethyleringsanalyse. Aangezien bisulfiet niet-gemethyleerde cytosines in het genoom kan omzetten in uracils en vervolgens vervangen door thymines tijdens PCR amplificatie, die kan worden onderscheiden van de cytosine oorspronkelijk gewijzigd door methylering door het tellen van cytosines en thymines voor elke positie na sequencing (figuur 1). Whole genome bisulfiet sequencing (WGBS), als een onderzoeksmethode van groot belang op dit gebied, past een combinatie van bisulfiet behandeling en volgende / derde generatie sequencing technologieën (meestal, shotgun sequencing) om DNA methylering te bestuderen op genoom-niveau.

Principles and Workflow of Whole Genome Bisulfite Sequencing

Figuur 1. Bisulfietconversie en PCR-amplificatie voorafgaand aan DNA-sequencing.

Voordelen van genoombrede bisulfietsequencing

  • Het mogelijk maken van genoombrede methyleringsprofilering op single-baseniveau.
  • Het beoordelen van de methyleringsstatus van bijna elke CpG-locus, inclusief intergene “gen-woestijnen”, gedeeltelijke methyleringsdomeinen, en afgelegen regulerende elementen.
  • Het onthullen van absolute DNA-methyleringsniveaus en methyleringssequentie-achtergrond.

Workflow van hele genoom bisulfietsequencing

In het kort, de basisstappen van hele genoom bisulfietsequencing (WGBS) omvatten DNA-extractie, bisulfietconversie, bibliotheekvoorbereiding, sequencing, en bioinformatica-analyse. Hier gebruiken we Illumina HiSeq als voorbeeld om de workflow van WGBS te illustreren.

Principles and Workflow of Whole Genome Bisulfite Sequencing

Figuur 2. De workflow van whole genome bisulfietsequencing (Khanna et al. 2013).

  • DNA-extractie

Eerst wordt ongeveer 1-5 mg weefselmonsters die bij mensen, dieren, planten of micro-organismen zijn verzameld, geprepareerd voor DNA. In het algemeen moeten monsters voor whole-genome bisulfietsequencing aan de volgende vier kenmerken voldoen.

i. Eukaryoten;

ii. Hypomethylering (zoals aangetoond in figuur 3, hebben studies aangetoond dat zodra het aantal CpG-sites in een regio toeneemt, de sequencinggegevens van WGBS beginnen af te nemen);

iii. Het referentiegenoom is ten minste tot op scaffoldniveau geassembleerd;

iv. Relatief volledige genoomannotaties. En vervolgens een geschikte kit toepassen om DNA met een hoge zuiverheid en een hoog moleculair gewicht te extraheren. Het geëxtraheerde DNA moet een massa hebben van niet minder dan 5 μg, een concentratie van niet minder dan 50 ng/ul, en een OD260/280 van 1,8 tot 2,0.

Principles and Workflow of Whole Genome Bisulfite Sequencing

Figuur 3. Conventionele WGBS-technologie heeft een lage dekking van methyleringssites (Raine et al. 2016)

  • Bisulfietconversie

Bisulfietconversie wordt beschouwd als de “gouden standaard” voor DNA-methyleringsanalyse, de principes zijn weergegeven in figuur 4. Voor deze methode kan door BS geïnduceerde DNA-afbraak leiden tot depletie van genomische regio’s die verrijkt zijn met ongemethyleerde cytosines. Daarom is het belangrijk om de hoeveelheid DNA-afbraak onder reactieomstandigheden te beoordelen, en hoe dit het gewenste amplicon beïnvloedt, moet ook worden overwogen. Olova et al. (2018) vonden dat DNA-degradatie sterk is in bisulfietconversieprotocollen die gebruikmaken van hoge denaturatie of hoge bisulfietmolariteit. Er zijn verschillende kits beschikbaar in de markt (tabel 2).

Principles and Workflow of Whole Genome Bisulfite Sequencing

Figuur 4. Bisulfiet-gemedieerde deaminatie van cytosine (Hayatsu et al. 2004).

Tabel 2. Protocollen en parameters voor bisulfietomzetting.

Kits Denaturatie Omzettingstemperatuur Incubatietijd
Zymo EZ DNA Methylation Lightning Kit Op basis van warmte; 99 ° C
Op basis van alkaline; 37 °C
65 °C 90 minuten
EpiTect Bisulfite kit (Qiagen) Op basis van warmte; 99 °C 55 °C 10 uur
EZ DNA Methylation Kit (Zymo Research) Op basis van alkaline; 37 °C 50 °C 12-16 uur
  • Bibliotheekvoorbereiding

Neem als voorbeeld de EpiGnomeTM Methyl-Seq Kit (Epicentre) (zoals afgebeeld in figuur 5), Met bisulfiet behandeld enkelstrengs DNA wordt willekeurig geprimed met behulp van een polymerase die uracilnucleotiden kan lezen, om DNA te synthetiseren dat een specifieke sequentietag bevat. Het 3′-uiteinde van de nieuw gesynthetiseerde DNA-streng wordt vervolgens selectief gelabeld met een tweede specifieke sequentie, zodat een DNA-molecuul met twee markers en een bekend sequentietag aan het 5′- en het 3′-uiteinde kan worden verkregen. Illumina P7 en P5 adapters worden vervolgens toegevoegd door PCR aan de 5 en 3 uiteinden voorafgaand aan DNA-sequencing.

Principles and Workflow of Whole Genome Bisulfite Sequencing

Figuur 5. Workflow voor de EpiGnomeTM Methyl-Seq Kit.

  • Sequencing

Hiseq-sequencingtechnologie, een nieuwe sequencingmethode op basis van sequencing-by-synthesis (SBS), wordt op grote schaal toegepast voor WGBS. De brugamplificatie op een flowcel wordt bereikt door gebruik te maken van een enkel molecuul array. Aangezien de nieuwe omkeerbare blokkeertechniek slechts één base tegelijk kan synthetiseren en de fluorofoor van een label kan voorzien, wordt de corresponderende laser gebruikt om de fluorofoor te exciteren, en kan het excitatielicht worden opgevangen om de base-informatie af te lezen. De gepaarde-end 150 bp-strategie wordt typisch gebruikt in WGBS voor de sequentie van 250-300 bp insertie bisulfiet-behandelde DNA-bibliotheken. Naast Illumina HiSeq worden ook PacBio SMRT, Nanopore, Roche 454 en andere Illumina-platforms veelvuldig voor dit doel gebruikt.

  • Analyse van gegevens

Er kan een reeks analyses worden uitgevoerd op de sequencingresultaten. In tabel 3 worden vijf hoofdtypen informatieanalyse genoemd. Daarnaast kunnen ook methyleringsdichtheidsanalyse, differentieel gemethyleerde regio (DMR)-analyse, DMR-annotatie en verrijkingsanalyse (GO/KEGG) en clusteringsanalyse worden uitgevoerd. De gemeenschappelijke bioinformatische bronnen van WGBS omvatten BDPC, CpGcluster, CpGFinder, Epinexus, MethTools, mPod, QUMA, en TCGA Data Portal.

Tabel 3. Belangrijkste types van WGBS data-analyse.

Type Details
Alignatie tegen referentiegenoom Tools, zoals SOAP software, worden gebruikt om de reads te vergelijken met de referentiegenoomsequentie, en alleen de uitgelijnde reads zullen worden gebruikt voor de analyse van methyleringsinformatie. Align leest waardoor C-C matches en C-T mismatches.
mC calling Bepaal mC positie in het genoom. mC ratio’s worden berekend door het overwegen van lees kwaliteit en multi-locus mapping waarschijnlijkheden. Discard small-probability alignment dat een lage betrouwbaarheid van de uitlijning heeft.
Sequence diepte en dekking analyse Een beeld dat de relatie tussen gen dekking en sequencing diepte weergeeft bepaalt of methylatie ontdekking kan worden gedaan met een bepaalde mate van vertrouwen op specifieke base posities.
Methylatie niveau analyse Het methylatie niveau van elke gemethyleerde C base wordt als volgt berekend: 100*reads/totaal gelezen. Het genoom-brede gemiddelde methyleringsniveau weerspiegelt de algemene kenmerken van het genoom-methyleringsprofiel.
Globale trends van methylome De distributieratio van CG, CHGG en CHH in gemethyleerde C-basen weerspiegelt de kenmerken van het hele genoom methyleringskaarten van specifieke soorten tot op zekere hoogte.

Featured services:

Whole genome bisulfite sequencing

Targeted bisulfite sequencing

ChIP-seq

Reduced Representation Bisulfite Sequencing

  1. Fraga, M. F., Esteller, M. (2002). Dna-methylering: een profiel van methoden en toepassingen. Biotechniques, 33(3), 636-49.
  2. Green, R. E., Krause, J., Briggs, A. W., Maricic, T., Stenzel, U., et al. (2010). Een concept-sequentie van het Neandertaler genoom. Science, 328(5979), 710-722.
  3. Hayatsu, H., Negishi, K., & Shiraishi, M. (2004). DNA methylation analysis: speedup of bisulfite-mediated deamination of cytosine in the genomic sequencing procedure. Proceedings of the Japan Academy,80(4), 189-194.
  4. Herman, J. G., Graff, J. R., Myöhänen, S., Nelkin, B. D., & Baylin, S. B. (1996). Methylation-specific pcr: a novel pcr assay for methylation status of cpg islands. Proceedings of the National Academy of Sciences of the United States of America, 93(18), 9821-9826.
  5. Ji, L., Sasaki, T., Sun, X., Ma, P., Lewis, Z. A., & Schmitz, R. J. (2014). Gemethyleerd dna is oververtegenwoordigd in whole-genome bisulfiet sequencing data. Front Genet, 5(5), 341.
  6. Khanna, A., Czyz, A., & Syed, F. (2013). Epignome methyl-seq kit: een nieuwe post-bisulfiet conversie library prep methode voor methylatie analyse. Nature Methods, 10(10).
  7. Laird, P. W. (2003). The power and the promise of DNA methylation markers. Nature Reviews Cancer, 3(4), 253-266. doi:10.1038/nrc1045
  8. Laura-Jayne, G., Mark, Q. T., Lisa, O., Jonathan, P., Neil, H., & Anthony, H. (2015). Een genoom-breed overzicht van dna-methylering in hexaploïde tarwe. Genome Biology, 16(1), 273.
  9. Lin Liu, Ni Hu, Bo Wang, Minfeng Chen, Juan Wang, & Zhijian Tian, et al. (2011). Een kort gebruiksverslag van de illumina hiseq 2000 sequencer. Mycology, 2(3), 169-191.
  10. Meissner, A., Gnirke, A., Bell, G. W., Ramsahoye, B., Lander, E. S., & Jaenisch, R. (2005). Reduced representation bisulfite sequencing for comparative high-resolution dna methylation analysis. Nucleic Acids Research, 33(18), 5868-77.
  11. Meyer, M., Kircher, M., Gansauge, M. T., Li, H., Racimo, F., & Mallick, S., et al. (2012). Een hoge dekking genoomsequentie van een archaïsche denisovan individu. Science, 338(6104), 222-6.
  12. Olova, N., Krueger, F., Andrews, S., Oxley, D., Berrens, R. V., & Branco, M. R., et al. (2018). Vergelijking van whole-genome bisulfiet sequencing bibliotheek voorbereidingsstrategieën identificeert bronnen van biases die van invloed zijn op dna methylatie gegevens. Genome Biology, 19(1), 33.
  13. Raine, A., Manlig, E., Wahlberg, P., Syvänen, A. C., & Nordlund, J. (2016). Splinted ligatie adapter tagging (splat), een nieuwe bibliotheek bereidingsmethode voor het hele genoom bisulfiet sequencing. Nucleic Acids Research, 45(6), e36.
  14. Ziller, M. J., Müller, F., Liao, J., Zhang, Y., Gu, H., & Bock, C., et al. (2011). Genomic distribution and inter-sample variation of non-cpg methylation across human cell types. Plos Genetics, 7(12), e1002389.
* For Research Use Only. Niet voor gebruik in diagnostische procedures.