Articles

Principles and Workflow of Whole Genome Bisulfite Sequencing

Principles of whole genome bisulfite sequencing

Badania epigenetyczne potwierdziły, że modyfikacja metylacji DNA specyficznych regionów genów odgrywa ważną rolę w konformacji chromosomów i regulacji ekspresji genów. Metylacja reszt cytozyny DNA przy C5 (5meC) jest powszechnym znakiem epigenetycznym u wielu eukariotów i jest szeroko rozpowszechniona w CpG lub CpHpG (H=A, T, C). Istnieją głównie trzy podejścia, w tym trawienie endonukleazą, wzbogacanie powinowactwem i konwersja bisulfitowa (Tabela 1). Prawie wszystkie metody analizy metylacji DNA specyficznej dla danej sekwencji wymagają obróbki zależnej od metylacji przed amplifikacją lub hybrydyzacją w celu zachowania wierności. Różne techniki biologii molekularnej, takie jak sekwencjonowanie następnej generacji (NGS), są następnie wykonywane w celu wykrycia reszt 5meC.

Tabela 1. Główne zasady analizy metylacji opartej na NGS.

Trawienie enzymatyczne

Wzbogacanie powinowactwa

Bisulfit sodu

Zasady

Niektóre enzymy restrykcyjne, takie jak HpaII i SmaI, są hamowane przez 5meC w CpG. Wzbogacanie metodą powinowactwa wykorzystuje przeciwciała specyficzne dla 5meC lub białka wiążące metyl z powinowactwem do profilowania metylacji DNA. Bisiarczyn sodu chemicznie zamienia niemetylowaną cytozynę w uracyl, umożliwiając w ten sposób wykrywanie metylacji.

Przykład metody

Methyl-seq

*MCA-seq

*HELP-seq

*MSCC

*MeDIP-seq

*MIRA-seq

*RRBS

*WGBS

*BSPP

*MCA: amplifikacja metylowanych wysp CpG; *HELP: HpaII tiny fragment enrichment by ligation-mediated PCR; *MSCC: methylation-sensitive cut counting; *MeDIP-seq: methylated DNA immunoprecipitation; *MIRA: methylated CpG island recovery assay; *RRBS: reduced representation bisulfite sequencing; *WGBS: whole genome bisulfite sequencing; *BSPP: bisulfite padlock probes.

Konwersja bisulfitowa wywołała rewolucję w analizie metylacji genomu w latach 90-tych. Ponieważ bisulfit może przekształcić niemetylowane cytozyny w genomie w uracyle, a następnie zastąpić je tyminami podczas amplifikacji PCR, które można odróżnić od cytozyny pierwotnie zmodyfikowanej przez metylację, licząc cytozyny i tyminy dla każdej pozycji po sekwencjonowaniu (rysunek 1). Sekwencjonowanie bisulfitowe całego genomu (WGBS), jako metoda badawcza o dużym znaczeniu w tej dziedzinie, stosuje połączenie obróbki bisulfitowej i technologii sekwencjonowania następnej/trzeciej generacji (głównie, sekwencjonowania typu shotgun) do badania metylacji DNA na poziomie genomowym.

Principles and Workflow of Whole Genome Bisulfite Sequencing

Rysunek 1. Konwersja bisulfitowa i amplifikacja PCR przed sekwencjonowaniem DNA.

Wady sekwencjonowania bisulfitowego całego genomu

  • Umożliwienie profilowania metylacji całego genomu na poziomie pojedynczej bazy.
  • Ocena statusu metylacji prawie każdego locus CpG, w tym międzygenowych „pustyń genowych”, domen częściowej metylacji i odległych elementów regulacyjnych.
  • Ujawnienie absolutnych poziomów metylacji DNA i tła sekwencji metylacji.

Przebieg pracy sekwencjonowania bisulfitowego całego genomu

W skrócie, podstawowe kroki sekwencjonowania bisulfitowego całego genomu (WGBS) obejmują ekstrakcję DNA, konwersję bisulfitową, przygotowanie biblioteki, sekwencjonowanie i analizę bioinformatyczną. Tutaj używamy Illumina HiSeq jako naszego przykładu, aby zilustrować przepływ pracy WGBS.

Principles and Workflow of Whole Genome Bisulfite Sequencing

Rysunek 2. Przepływ pracy całego genomowego sekwencjonowania bisulfitowego (Khanna et al. 2013).

  • Ekstrakcja DNA

Na początku przygotowuje się około 1-5 mg próbek tkanek pobranych od ludzi, zwierząt, roślin lub mikroorganizmów w celu pozyskania DNA. Ogólnie rzecz biorąc, próbki do sekwencjonowania bisulfitowego całego genomu muszą spełniać następujące cztery cechy.

i. Eukariota;

ii. Hipometylacja (jak pokazano na Rysunku 3, badania wykazały, że gdy liczba miejsc CpG w regionie wzrasta, dane sekwencjonowania WGBS zaczynają się zmniejszać);

iii. Jego genom referencyjny został złożony co najmniej do poziomu rusztowania;

iv. Stosunkowo kompletne anotacje genomu. A następnie zastosować odpowiedni zestaw do ekstrakcji DNA o wysokiej czystości i masie cząsteczkowej. Wyekstrahowane DNA powinno mieć masę nie mniejszą niż 5 μg, stężenie nie mniejsze niż 50 ng/ul, a OD260/280 od 1,8 do 2,0.

Principles and Workflow of Whole Genome Bisulfite Sequencing

Rys. 3. Konwencjonalna technologia WGBS charakteryzuje się niskim pokryciem miejsc metylacji (Raine et al. 2016)

  • Konwersja dwusiarczynowa

Konwersja dwusiarczynowa jest uważana za „złoty standard” w analizie metylacji DNA, zasady zostały przedstawione na Rysunku 4. W przypadku tej metody degradacja DNA wywołana BS może prowadzić do zubożenia regionów genomowych wzbogaconych o niemetylowane cytozyny. Dlatego ważne jest, aby ocenić wielkość degradacji DNA w warunkach reakcji, należy również rozważyć, jak wpływa to na pożądany amplikon. Olova i wsp. (2018) stwierdzili, że degradacja DNA jest silna w protokołach konwersji bisulfitowej, które wykorzystują wysoką denaturację lub wysoką molarność bisulfitu. Na rynku dostępnych jest kilka zestawów (Tabela 2).

Principles and Workflow of Whole Genome Bisulfite Sequencing

Rysunek 4. Mediowana przez bisulfit deaminacja cytozyny (Hayatsu i wsp. 2004).

Tabela 2. Protokoły i parametry konwersji bisulfitowej.

Kity Denaturacja Temperatura konwersji Czas inkubacji
Zymo EZ DNA Methylation Lightning Kit Heat-based; 99 °C
Alkaline-based; 37 °C
65 °C 90 minut
EpiTect Bisulfite kit (Qiagen) Heat-based; 99 °C 55 °C 10 godzin
EZ DNA Methylation Kit (Zymo Research) Alkaline-based; 37 °C 50 °C 12-16 godzin
  • Przygotowanie biblioteki

Przyjąć EpiGnomeTM Methyl-Seq Kit (Epicentre) jako przykład (jak pokazano na rysunku 5), jednoniciowe DNA poddane działaniu bisulfitu jest randomizowane przy użyciu polimerazy zdolnej do odczytu nukleotydów uracylu, w celu syntezy DNA zawierającego specyficzny znacznik sekwencji. Koniec 3′ nowo zsyntetyzowanej nici DNA jest następnie selektywnie znakowany drugą specyficzną sekwencją, w ten sposób można uzyskać dwumarkerową cząsteczkę DNA ze znanym znacznikiem sekwencji na końcach 5′ i 3′. Adaptery Illumina P7 i P5 są następnie dodawane przez PCR na końcach 5 i 3 przed sekwencjonowaniem DNA.

Principles and Workflow of Whole Genome Bisulfite Sequencing

Rysunek 5. Przepływ pracy dla zestawu EpiGnomeTM Methyl-Seq Kit.

  • Sekwencjonowanie

Technologia sekwencjonowania Hiseq, nowatorska metoda sekwencjonowania oparta na sekwencjonowaniu przez syntezę (SBS), jest szeroko stosowana do WGBS. Amplifikacja mostkowa na komórce przepływowej jest osiągana dzięki zastosowaniu matrycy pojedynczych molekuł. Ponieważ nowa technika odwracalnego blokowania może syntetyzować tylko jedną zasadę na raz i znakować fluorofor, odpowiedni laser jest używany do wzbudzenia fluoroforu, a światło wzbudzenia może być przechwycone w celu odczytania informacji o bazie. Strategia parowanych końców 150 bp jest typowo stosowana w WGBS do sekwencjonowania bibliotek DNA o długości 250-300 bp poddanych działaniu bisulfitu. Oprócz Illumina HiSeq, do tego celu powszechnie stosowane są również platformy PacBio SMRT, Nanopore, Roche 454 i inne platformy Illumina.

  • Analiza danych

Dla wyników sekwencjonowania można wykonać szereg analiz. Pięć głównych typów analizy informacji wymieniono w tabeli 3. Ponadto, można również przeprowadzić analizę gęstości metylacji, analizę różnie metylowanych regionów (DMR), analizę anotacji DMR i analizę wzbogacenia (GO/KEGG) oraz analizę skupień. Wspólne zasoby bioinformatyczne WGBS obejmują BDPC, CpGcluster, CpGFinder, Epinexus, MethTools, mPod, QUMA i TCGA Data Portal.

Tabela 3. Główne typy analizy danych WGBS.

Typ Szczegóły
Alignment against reference genome Narzędzia, takie jak oprogramowanie SOAP, są używane do porównywania odczytów z sekwencją genomu referencyjnego i tylko wyrównane odczyty będą wykorzystywane do analizy informacji o metylacji. Wyrównanie odczytów pozwalające na dopasowanie C-C i niedopasowanie C-T.
wywołanie mC Określenie pozycji mC w całym genomie. Współczynniki mC są obliczane przez uwzględnienie jakości odczytów i prawdopodobieństwa mapowania wielu ognisk. Discard small-probability alignment that has a low reliability of alignment.
Analiza głębokości sekwencji i pokrycia Obraz odzwierciedlający relację między pokryciem genów a głębokością sekwencjonowania określa, czy odkrycie metylacji może być dokonane z pewnym stopniem pewności w określonych pozycjach bazowych.
Analiza poziomu metylacji Poziom metylacji każdej metylowanej zasady C jest obliczany w następujący sposób: 100*reads/total reads. Średni poziom metylacji w całym genomie odzwierciedla ogólną charakterystykę profilu metylacji genomu.
Globalne trendy metylomu Stosunek dystrybucji CG, CHGG i CHH w metylowanych zasadach C odzwierciedla w pewnym stopniu charakterystykę map metylacji całego genomu poszczególnych gatunków.

Usługi rozszerzone:

Sekwencjonowanie bisulfitowe całego genomu

Sekwencjonowanie bisulfitowe ukierunkowane

ChIP-seq

Sekwencjonowanie bisulfitowe o zredukowanej reprezentacji

  1. Fraga, M. F., Esteller, M. (2002). Metylacja dna: profil metod i zastosowań. Biotechniques, 33(3), 636-49.
  2. Green, R. E., Krause, J., Briggs, A. W., Maricic, T., Stenzel, U., et al. (2010). A Draft Sequence of the Neandertal Genome. Science, 328(5979), 710-722.
  3. Hayatsu, H., Negishi, K., & Shiraishi, M. (2004). DNA methylation analysis: speedup of bisulfite-mediated deamination of cytosine in the genomic sequencing procedure. Proceedings of the Japan Academy,80(4), 189-194.
  4. Herman, J. G., Graff, J. R., Myöhänen, S., Nelkin, B. D., & Baylin, S. B. (1996). Methylation-specific pcr: a novel pcr assay for methylation status of cpg islands. Proceedings of the National Academy of Sciences of the United States of America, 93(18), 9821-9826.
  5. Ji, L., Sasaki, T., Sun, X., Ma, P., Lewis, Z. A., & Schmitz, R. J. (2014). Methylated dna is over-represented in whole-genome bisulfite sequencing data. Front Genet, 5(5), 341.
  6. Khanna, A., Czyż, A., & Syed, F. (2013). Epignome methyl-seq kit: a novel post-bisulfite conversion library prep method for methylation analysis. Nature Methods, 10(10).
  7. Laird, P. W. (2003). The power and the promise of DNA methylation markers. Nature Reviews Cancer, 3(4), 253-266. doi:10.1038/nrc1045
  8. Laura-Jayne, G., Mark, Q. T., Lisa, O., Jonathan, P., Neil, H., & Anthony, H. (2015). A genome-wide survey of dna methylation in hexaploid wheat. Genome Biology, 16(1), 273.
  9. Lin Liu, Ni Hu, Bo Wang, Minfeng Chen, Juan Wang, & Zhijian Tian, et al. (2011). A brief utilization report on the illumina hiseq 2000 sequencer. Mycology, 2(3), 169-191.
  10. Meissner, A., Gnirke, A., Bell, G. W., Ramsahoye, B., Lander, E. S., & Jaenisch, R. (2005). Reduced representation bisulfite sequencing for comparative high-resolution dna methylation analysis. Nucleic Acids Research, 33(18), 5868-77.
  11. Meyer, M., Kircher, M., Gansauge, M. T., Li, H., Racimo, F., & Mallick, S., et al. (2012). A high coverage genome sequence from an archaic denisovan individual. Science, 338(6104), 222-6.
  12. Olova, N., Krueger, F., Andrews, S., Oxley, D., Berrens, R. V., & Branco, M. R., et al. (2018). Comparison of whole-genome bisulfite sequencing library preparation strategies identifies sources of biases affecting dna methylation data. Genome Biology, 19(1), 33.
  13. Raine, A., Manlig, E., Wahlberg, P., Syvänen, A. C., & Nordlund, J. (2016). Splinted ligation adapter tagging (splat), a novel library preparation method for whole genome bisulphite sequencing. Nucleic Acids Research, 45(6), e36.
  14. Ziller, M. J., Müller, F., Liao, J., Zhang, Y., Gu, H., & Bock, C., et al. (2011). Genomic distribution and inter-sample variation of non-cpg methylation across human cell types. Plos Genetics, 7(12), e1002389.
* Wyłącznie do użytku badawczego. Nie do użytku w procedurach diagnostycznych.

.