Articles

Principer och arbetsflöde för bisulfitsekvensering av hela genomet

Principer för bisulfitsekvensering av hela genomet

Epigenetiska studier har bekräftat att DNA-metyleringsmodifiering av specifika genregioner spelar en viktig roll för kromosomkonformation och reglering av genuttryck. Metylering av DNA:s cytosinrester vid C5 (5meC) är en vanlig epigenetisk markering i många eukaryoter och förekommer ofta i CpG eller CpHpG (H=A, T, C). Det finns huvudsakligen tre tillvägagångssätt, bland annat endonukleasdigestion, affinitetsberikning och bisulfitkonvertering (tabell 1). Nästan alla sekvensspecifika metoder för analys av DNA-metylering kräver en metyleringsberoende behandling före amplifiering eller hybridisering för att bibehålla tillförlitligheten. Olika molekylärbiologiska tekniker, t.ex. nästa generations sekvensering (NGS), utförs därefter för att upptäcka 5meC-rester.

Tabell 1. Huvudprinciper för NGS-baserad metyleringsanalys.

Enzymspjälkning

Affinitetsberikning

Natriumbisulfit

Principer

Vissa restriktionsenzymer, såsom HpaII och SmaI, hämmas av 5meC i CpG. Affinitetsberikning använder antikroppar som är specifika för 5meC eller metylbindande proteiner med affinitet för profilering av DNA-metylering. Natriumbisulfit omvandlar kemiskt ommetylerat cytosin till uracil, vilket gör det möjligt att upptäcka metylering.

Exempel på metod

Metyl-seq

*MCA-seq

*HELP-seq

*MSCC

*MeDIP-seq

*MIRA-seq

*RRBS

*WGBS

*BSPP

*MCA: Methylated CpG island amplification (amplifiering av metylerade CpG-öar): HpaII tiny fragment enrichment by ligation-mediated PCR; *MSCC: methylation-sensitive cut counting; *MeDIP-seq: metylerat DNA-immunoprecipitation; *MIRA: methylated CpG island recovery assay; *RRBS: reduced representation bisulfite sequencing; *WGBS: whole genome bisulfite sequencing; *BSPP: bisulfite padlock probes.

Bisulfitkonvertering ledde till en revolution inom analys av metylering av genomet på 1990-talet. Eftersom bisulfit kan omvandla ommetylerade cytosiner i genomet till uracils och sedan ersättas av thymin under PCR-amplifiering, vilket kan särskiljas från det cytosin som ursprungligen modifierats genom metylering genom att räkna cytosiner och thymin för varje position efter sekvensering (figur 1). Hela genomet bisulfitsekvensering (WGBS), som är en forskningsmetod av stor betydelse på detta område, tillämpar en kombination av bisulfitbehandling och nästa/tredje generationens sekvenseringsteknik (oftast shotgun-sekvensering) för att studera DNA-metylering på genomisk nivå.

Principles and Workflow of Whole Genome Bisulfite Sequencing

Figur 1. Bisulfitkonvertering och PCR-amplifiering före DNA-sekvensering.

Fördelar med bisulfitsekvensering av hela genomet

  • Möjliggör metylering av metylering över hela genomet på en enda basnivå.
  • Bedömning av metyleringsstatusen för nästan alla CpG-lokus, inklusive intergeniska ”genöknar”, partiella metyleringsdomäner och avlägsna reglerande element.
  • Revoutera absoluta DNA-metyleringsnivåer och metyleringssekvensbakgrund.

Arbetsflöde för bisulfitsekvensering av hela genomet

I korthet omfattar de grundläggande stegen för bisulfitsekvensering av hela genomet (WGBS) DNA-extraktion, bisulfitkonvertering, framställning av bibliotek, sekvensering och bioinformatisk analys. Här använder vi Illumina HiSeq som exempel för att illustrera arbetsflödet för WGBS.

Principles and Workflow of Whole Genome Bisulfite Sequencing

Figur 2. Arbetsflödet för bisulfitsekvensering av hela genomet (Khanna et al. 2013).

  • DNA-extraktion

Först förbereds cirka 1-5 mg av vävnadsprover som samlats in från människor, djur, växter eller mikroorganismer för DNA. I allmänhet måste prover för bisulfitsekvensering av hela genomet uppfylla följande fyra egenskaper.

i. Eukaryoter;

ii. Hypometylering (som visas i figur 3 har studier visat att när antalet CpG-platser i en region ökar börjar sekvenseringsdata från WGBS att minska);

iii. Dess referensgenom har sammanställts åtminstone till scaffoldnivå;

iv. Relativt fullständiga genomannotationer. Använd sedan ett lämpligt kit för att extrahera DNA med hög renhet och hög molekylvikt. Det extraherade DNA:t bör ha en massa på minst 5 μg, en koncentration på minst 50 ng/ul och en OD260/280 på 1,8 till 2,0.

Principles and Workflow of Whole Genome Bisulfite Sequencing

Figur 3. Konventionell WGBS-teknik har låg täckning av metyleringsställen (Raine et al. 2016)

  • Bisulfitkonvertering

Bisulfitkonvertering anses vara ”guldstandarden” för DNA-metyleringsanalys, principerna har visats i figur 4. För denna metod kan BS-inducerad DNA-nedbrytning leda till utarmning av genomiska regioner som är berikade med ometylerade cytosiner. Det är därför viktigt att bedöma mängden DNA-nedbrytning under reaktionsförhållandena, och hur detta påverkar den önskade amplikonen bör också beaktas. Olova et al. (2018) fann att DNA-nedbrytningen är stark i bisulfitkonverteringsprotokoll som använder hög denaturering eller hög bisulfitmolaritet. Det finns flera kit tillgängliga på marknaden (tabell 2).

Principles and Workflow of Whole Genome Bisulfite Sequencing

Figur 4. Bisulfitmedierad deaminering av cytosin (Hayatsu et al. 2004).

Tabell 2. Protokoll och parametrar för bisulfitomvandling.

Kit Denaturering Konverteringstemperatur Inkubationstid
Zymo EZ DNA Methylation Lightning Kit Värmebaserat; 99 °C
Alkaliskt baserat; 37 °C
65 °C 90 minuter
EpiTect Bisulfite kit (Qiagen) Värmebaserad; 99 °C 55 °C 10 timmar
EZ DNA Methylation Kit (Zymo Research) Alkalibaserad; 37 °C 50 °C 12-16 timmar

  • Biblioteksförberedelse

Tag EpiGnomeTM Methyl-Seq Kit (Epicentre) som ett exempel (se figur 5), Bisulfitbehandlat enkelsträngat DNA slumpas med hjälp av ett polymeras som kan läsa uracilnukleotider för att syntetisera DNA som innehåller en specifik sekvensmarkering. 3′-änden av den nysyntetiserade DNA-strängen märks sedan selektivt med en andra specifik sekvens, vilket gör att man får en DNA-molekyl med två markörer med en känd sekvensmarkering i 5′- och 3′-änden. Illumina P7- och P5-adaptrar läggs därefter till genom PCR vid 5 och 3 ändarna före DNA-sekvensering.

Principles and Workflow of Whole Genome Bisulfite Sequencing

Figur 5. Arbetsflöde för EpiGnomeTM Methyl-Seq-kit.

  • Sekvensering

Hiseq-sekvenseringsteknik, en ny sekvenseringsmetod baserad på sekvensering genom syntes (SBS), används i stor utsträckning för WGBS. Broamplifieringen på en flödescell uppnås med hjälp av en enda molekylär array. Eftersom den nya reversibla blockeringstekniken kan syntetisera endast en bas åt gången och märka fluoroforen, används motsvarande laser för att excitera fluoroforen, och excitationsljuset kan fångas upp för att läsa av basinformationen. Paired-end 150 bp-strategin används vanligtvis i WGBS för att sekvensera 250-300 bp insatta bisulfitbehandlade DNA-bibliotek. Förutom Illumina HiSeq används även PacBio SMRT, Nanopore, Roche 454 och andra Illumina-plattformar ofta för detta ändamål.

  • Dataanalys

En rad analyser kan utföras för sekvenseringsresultaten. Fem huvudtyper av informationsanalyser anges i tabell 3. Dessutom kan analys av metyleringstäthet, analys av differentiellt metylerade regioner (DMR), DMR-annotation och berikningsanalys (GO/KEGG) och klusteranalys också utföras. De gemensamma bioinformatiska resurserna för WGBS omfattar BDPC, CpGcluster, CpGFinder, Epinexus, MethTools, mPod, QUMA och TCGA Data Portal.

Tabell 3. Huvudtyper av analys av WGBS-data.

Typ Detaljer
Avstämning mot referensgenom Verktyg, t.ex. SOAP-programvara, används för att jämföra läsningarna med referensgenomsekvensen, och endast de avstämda läsningarna kommer att användas för analys av metyleringsinformation. Justera läsningar som tillåter C-C matchningar och C-T missmatchningar.
mC calling Detektera mC-positionen i hela genomet. mC-förhållanden beräknas genom att ta hänsyn till läskvalitet och sannolikheter för mappning av multilocus. Kassera anpassningar med liten sannolikhet som har en låg tillförlitlighet i anpassningen.
Analys av sekvensdjup och täckning En bild som återspeglar förhållandet mellan genernas täckning och sekvenseringsdjup bestämmer om metyleringsupptäckt kan göras med en viss grad av tillförlitlighet vid specifika baspositioner.
Analys av metyleringsnivå Metyleringsnivån för varje metylerad C-bas beräknas på följande sätt: 100*läsningar/totala läsningar. Den genomsnittliga metyleringsnivån för hela genomet återspeglar de övergripande egenskaperna hos den genomiska metyleringsprofilen.
Globala trender hos metylomet Fördelningsförhållandet mellan CG, CHGG och CHH i metylerade C-baser återspeglar i viss mån egenskaperna hos metyleringskartor över hela genomet hos specifika arter.

Tjänster:

Helgenom bisulfitsekvensering

Targeted bisulfite sequencing

ChIP-seq

Reduced Representation Bisulfite Sequencing

  1. Fraga, M. F., Esteller, M. (2002). Dna-metylering: en profil av metoder och tillämpningar. Biotechniques, 33(3), 636-49.
  2. Green, R. E., Krause, J., Briggs, A. W., Maricic, T., Stenzel, U., et al. (2010). Ett utkast till sekvens av neandertalgenomet. Science, 328(5979), 710-722.
  3. Hayatsu, H., Negishi, K., & Shiraishi, M. (2004). Analys av DNA-metylering: snabbare bisulfitmedierad deaminering av cytosin i genomsekvenseringsproceduren. Proceedings of the Japan Academy,80(4), 189-194.
  4. Herman, J. G., Graff, J. R., Myöhänen, S., Nelkin, B. D., & Baylin, S. B. (1996). Metyleringsspecifik pcr: en ny pcr-analys för metyleringsstatus för cpg-öar. Proceedings of the National Academy of Sciences of the United States of America, 93(18), 9821-9826.
  5. Ji, L., Sasaki, T., Sun, X., Ma, P., Lewis, Z. A., & Schmitz, R. J. (2014). Metylerat dna är överrepresenterat i bisulfitsekvenseringsdata för hela genomet. Front Genet, 5(5), 341.
  6. Khanna, A., Czyz, A., & Syed, F. (2013). Epignome methyl-seq kit: en ny metod för att förbereda bibliotek efter bisulfitkonvertering för metyleringsanalys. Nature Methods, 10(10).
  7. Laird, P. W. (2003). Kraften och löftet av DNA-metyleringsmarkörer. Nature Reviews Cancer, 3(4), 253-266. doi:10.1038/nrc1045
  8. Laura-Jayne, G., Mark, Q. T., Lisa, O., Jonathan, P., Neil, H., & Anthony, H. (2015). En genomomfattande undersökning av dna-metylering i hexaploid vete. Genome Biology, 16(1), 273.
  9. Lin Liu, Ni Hu, Bo Wang, Minfeng Chen, Juan Wang, & Zhijian Tian, et al. (2011). En kort användningsrapport om illumina hiseq 2000 sequencer. Mycology, 2(3), 169-191.
  10. Meissner, A., Gnirke, A., Bell, G. W., Ramsahoye, B., Lander, E. S., & Jaenisch, R. (2005). Reduced representation bisulfite sequencing for comparative high-resolution dna methylation analysis. Nucleic Acids Research, 33(18), 5868-77.
  11. Meyer, M., Kircher, M., Gansauge, M. T., Li, H., Racimo, F., & Mallick, S., et al. (2012). En högtäckande genomsekvens från en arkaisk denisovanindivid. Science, 338(6104), 222-6.
  12. Olova, N., Krueger, F., Andrews, S., Oxley, D., Berrens, R. V., & Branco, M. R., et al. (2018). Jämförelse av strategier för beredning av biblioteksbibliotek för bisulfitsekvensering av hela genomet identifierar källor till bias som påverkar dna-metyleringsdata. Genome Biology, 19(1), 33.
  13. Raine, A., Manlig, E., Wahlberg, P., Syvänen, A. C., & Nordlund, J. (2016). Splinted ligation adapter tagging (splat), en ny metod för framställning av bibliotek för bisulfitsekvensering av hela genomet. Nucleic Acids Research, 45(6), e36.
  14. Ziller, M. J., Müller, F., Liao, J., Zhang, Y., Gu, H., & Bock, C., et al. (2011). Genomisk fördelning och variation mellan prover av icke-cpg-metylering i olika mänskliga celltyper. Plos Genetics, 7(12), e1002389.
* Endast för forskningsändamål. Får inte användas i diagnostiska förfaranden.