Articles

Principles and Workflow of Whole Genome Bisulfite Sequencing

Principles of whole genome bisulfite sequencing

Epigenetic studies, confirmed that DNA-methylation modification of specific gene regions played in chromosome conformation and gene expression regulation, the important role of a distant. C5におけるDNAシトシン残基のメチル化(5meC)は多くの真核生物に共通するエピジェネティックマークであり、CpGまたはCpHpG(H=A、T、C)に広く見いだされる。 主にエンドヌクレアーゼ消化、アフィニティー濃縮、バイサルファイト変換の3つのアプローチがある(表1)。 ほぼすべての配列特異的なDNAメチル化解析アプローチは、忠実性を維持するために増幅やハイブリダイゼーションの前にメチル化依存性の処理を行う必要がある。 次世代シーケンス (NGS) などのさまざまな分子生物学的手法は、その後、5meC 残基を検出するために実行される

Table 1. NGSを用いたメチル化解析の主な原理。

いくつかの制限酵素.がある。 HpaIIやSmaIなど、CpGの5meCによって阻害される。

*HELP-seq

*MSCC

*Methyl-seq

*MCA-seq*MIRA-seq

酵素消化

アフィニティー濃縮

バイサルファイトナトリウム

原則

Affinity enrichmentは、DNAメチル化のプロファイリングのために5meCまたは親和性のあるメチル結合タンパク質に特異的な抗体を用いる。 Sodium bisulfiteは化学的に非メチル化シトシンをウラシルに変え、したがってメチル化の検出を可能にする。

方法例

Methyl-seq

*MCA-seq

*HELP-seq

*MSCC

*MeDIP- *RRBS

*WGBS

*BSPP

*MCA: methylated CpG island amplification; *HELP: HpaII tiny fragment enrichment by ligation-mediated PCR; *MSCC: methylation-sensitive cut counting; *MeDIP-seq: methylated DNA immunoprecipitation; *MIRA: methylated CpG island recovery assay; *RRBS: reduced representation bisulfite sequencing; *WGBS: whole genome bisulfite sequencing; *BSPP: bisulfite padlock probes.BASPP は、BASPP: メチル化CpGアイランドプローブ。

ビスルファイト変換は1990年代にゲノムのメチル化解析に革命を起こした。 重亜硫酸塩がゲノム中のメチル化されていないシトシンをウラシルに変換し、PCR増幅時にチミンに置き換えることができるため、配列決定後に各位置のシトシンとチミンを数えることにより、もともとメチル化によって修飾されていたシトシンと区別することができる(図1)。 全ゲノムバイサルファイトシーケンス(WGBS)は、この分野で重要な研究手法として、バイサルファイト処理と次世代・第3世代シーケンサー技術(主にショットガンシーケンス)を組み合わせて、ゲノムレベルでのDNAメチル化研究に応用しています

Principles and Workflow of Whole Genome Bisulfite Sequencing

図1. 3583>

全ゲノムバイサルファイトシーケンスの利点

  • ゲノム全体のメチル化プロファイリングを1塩基レベルで可能にする
  • 遺伝子間の「遺伝子砂漠」、部分メチル化ドメイン、リモート制御要素を含むほぼすべてのCpG座のメチル化状態を評価することができる。
  • 絶対的なDNAメチル化レベルとメチル化配列バックグラウンドを明らかにする

全ゲノムバイサルファイトシーケンスのワークフロー

つまり、全ゲノムバイサルファイトシーケンス(WGBS)の基本ステップは、DNA抽出、バイサルファイト変換、ライブラリー準備、配列決定、バイオインフォマティクス解析が含まれます。 ここでは、Illumina HiSeqを例にして、WGBSのワークフローを説明する。

Principles and Workflow of Whole Genome Bisulfite Sequencing

図2. whole genome bisulfite sequencingのワークフロー(Khanna et al. 2013)

  • DNA抽出

まず、ヒト、動物、植物または微生物から採取した組織サンプル約1〜5mgをDNAの調製に使用します。 一般に、全ゲノムビスルファイトシーケンスのためのサンプルは、以下の4つの特徴を満たす必要がある。

i. 真核生物;

ii. ハイポメチル化(図3に示すように、ある領域のCpGサイト数が増加すると、WGBSのシーケンスデータは減少し始めるという研究結果が出ている);

iii. 参照ゲノムが少なくともスキャフォールドレベルまで組み立てられている;

iv. ゲノムのアノテーションが比較的完全である。 そして、適切なキットを適用して、高純度・高分子量のDNAを抽出する。 抽出されたDNAは、質量が5μg以上、濃度が50ng/ul以上、OD260/280が1.8〜2.0であることが望ましい

Principles and Workflow of Whole Genome Bisulfite Sequencing

図3. 従来のWGBS技術はメチル化部位のカバー率が低い(Raine et al. 2016)

  • Bisulfite Conversion

ビスサルファイト変換はDNAメチル化解析の「ゴールドスタンダード」と考えられており、原理は図4に示したとおりである。 この方法では、BSによるDNAの分解が、メチル化されていないシトシンに富むゲノム領域の枯渇につながる可能性がある。 したがって、反応条件下でのDNA分解量を評価することが重要であり、それが目的のアンプリコンにどのような影響を与えるかも考慮する必要がある。 Olovaら(2018)は、高変性または高ビスルファイトモル比を利用するビスルファイト変換プロトコルでは、DNAの分解が強いことを明らかにした。 市場にはいくつかのキットがある(表2)

Principles and Workflow of Whole Genome Bisulfite Sequencing

Figure 4. シトシンの重亜硫酸塩を介した脱アミノ化 (Hayatsu et al. 2004).

Table 2. Bisulfite変換プロトコルとパラメータ。

キット 変性 変換温度 培養時間
ジモEZ DNAメチル化ライトニングキット 熱ベース;99℃
Alkaline-based; 37 ℃
65 ℃ 90 分
EpiTect Bisulfite kit (Qiagen) Heat-based; 99 ℃ 55 ℃ 10 時間
EZ DNA Methylation Kit (Zymo Research) Alkaline-based; 37 ℃ 50 ℃ 12-16 時間
  • Library Preparation

EpiGnomeTM Methyl-Seq Kit (Epicentre) を例として(図5に示す)、その説明をします。 重亜硫酸塩処理した一本鎖DNAを、ウラシルヌクレオチドを読み取ることができるポリメラーゼを用いてランダムプライミングし、特定の配列タグを含むDNAを合成する。 このようにして、5’末端と3’末端に既知の配列タグを持つ2つのマーカーDNA分子を得ることができる。 イルミナP7およびP5アダプターは、その後、DNA配列決定の前に、5末端および3末端にPCRで付加されます

Principles and Workflow of Whole Genome Bisulfite Sequencing

図5. EpiGnomeTM Methyl-Seq Kitのワークフロー。

  • Sequencing

Hiseqシーケンス技術、SBS(sequencing by synthesis)に基づく新しいシーケンス方法は、WGBSに広く適用されています。 フローセル上でのブリッジ増幅は、1分子アレイを使用することで実現する。 新しい可逆的ブロッキング技術により、一度に1塩基のみを合成し、蛍光体を標識することができるため、対応するレーザーで蛍光体を励起し、その励起光を取り込んで塩基情報を読み取ることができる。 WGBSでは、250-300 bpの挿入型バイサルファイト処理DNAライブラリーのシーケンスに、ペアエンド150 bp戦略が一般的に採用される。

  • Data Analysis

シーケンス結果に対して一連の解析を実施することができます。 主な情報解析の種類を表3に示す。 さらに、メチル化密度解析、DMR(Differentially Methylated Region)解析、DMRアノテーション・濃縮解析(GO/KEGG)、クラスタリング解析も行うことができる。 WGBSの共通バイオインフォマティクスリソースとしては、BDPC、CpGcluster、CpGFinder、Epinexus、MethTools、mPod、QUMA、TCGA Data Portalがある

表3.表3.表3. WGBSデータ解析の主な種類

種類 詳細
参照ゲノムに対するアライメント SOAPソフトなどのツールを用いてリードを参照ゲノム配列と比較し、アライメントしたリードのみをメチル化情報解析に使用する。 C-CマッチとC-Tミスマッチを許容するリードをアラインする。
mC calling ゲノム全体のmC位置を決定する。mC比率はリード品質と多座マッピング確率を考慮して計算される。 アライメントの信頼性が低い確率の低いアライメントは破棄する。
配列深度とカバー率解析 遺伝子カバー率と配列深度の関係を反映した画像により、特定の塩基位置で一定の信頼性をもってメチル化発見ができるかどうかを判断する。
メチル化レベル解析 各メチル化C塩基のメチル化レベルは、下記の計算方法で算出する。 100*reads/total reads。 ゲノム全体の平均メチル化レベルは、ゲノムメチル化プロファイルの全体的な特徴を反映する。
メチロームのグローバルトレンド メチル化C塩基におけるCG、CHGG、CHHの分布比は、特定の種の全ゲノムメチル化マップの特徴をある程度反映している。

注目のサービス:

Whole genome bisulfite sequencing

Targeted bisulfite sequencing

ChIP-seq

Reduced Representation Bisulfite Sequencing

  • Fraga, M. F.・・・。 Esteller, M. (2002). Dnaメチル化:メソッドとアプリケーションのプロファイル。 Biotechniques, 33(3), 636-49.
  • Green, R. E., Krause, J., Briggs, A. W., Maricic, T., Stenzel, U.、他 (2010). ネアンデルタール人ゲノムのドラフト配列。 Science, 328(5979), 710-722.
  • Hayatsu, H., Negishi, K., & Shiraishi, M. (2004). DNAメチル化解析:ゲノムシークエンス手順におけるシトシンの重亜硫酸塩による脱アミノ化の高速化.
  • Herman, J. G., Graff, J. R., Myöhänen, S., Nelkin, B. D., & Baylin, S. B. (1996). Methylation-specific pcr: a novel pcr assay for methylation status of cpg islands(メチル化特異的pcr:cpg島のメチル化状態のための新規pcrアッセイ). Proceedings of the National Academy of Sciences of the United States of America, 93(18), 9821-9826.
  • Ji, L., Sasaki, T., Sun, X., Ma, P., Lewis, Z. A., & Schmitz, R. J. (2014).メチレーション特異的pcr:メチレーションアイランドのための新規pcrアッセイ。 メチル化されたdnaは全ゲノムのバイサルファイトシーケンスデータに過剰に存在する。 Front Genet, 5(5), 341.
  • Khanna, A., Czyz, A., & Syed, F. (2013).メチル化されたdnaは全ゲノムバイサルファイトシーケンスデータに多く含まれる。 Epignome methyl-seq kit: a novel post-bisulfite conversion library prep method for methylation analysis(エピグノーム・メチル-seqキット:メチル化解析のための新規ポストビスルファイト変換ライブラリープレパレーション法)。 Nature Methods, 10(10).
  • Laird, P. W. (2003). DNAメチル化マーカーの威力と将来性。 Nature Reviews Cancer, 3(4), 253-266. doi:10.1038/nrc1045
  • Laura-Jayne, G., Mark, Q. T., Lisa, O., Jonathan, P., Neil, H., & Anthony, H. (2015)(2015). 六倍体小麦のdnaメチル化に関するゲノムワイド調査。 Genome Biology, 16(1), 273.
  • Lin Liu, Ni Hu, Bo Wang, Minfeng Chen, Juan Wang, & Zhijian Tian、他(2011). illumina hiseq 2000シーケンサの簡単な使用レポート。 Mycology, 2(3), 169-191.
  • Meissner, A., Gnirke, A., Bell, G. W., Ramsahoye, B., Lander, E. S., & Jaenisch, R. (2005).を参照。 高分解能dnaメチル化比較解析のための縮小表示バイサルファイトシーケンス。 Nucleic Acids Research, 33(18), 5868-77.
  • Meyer, M., Kircher, M., Gansauge, M. T., Li, H., Racimo, F., & Mallick, S.、他 (2012). 古代のデニソバン個体からの高カバレッジゲノム配列。 Science, 338(6104), 222-6.
  • Olova, N., Krueger, F., Andrews, S., Oxley, D., Berrens, R. V., & Branco, M. R., et al. (2018). 全ゲノムバイサルファイトシーケンスライブラリー調製戦略の比較により、dnaメチル化データに影響を与えるバイアスの原因を特定した。 Genome Biology, 19(1), 33.
  • Raine, A., Manlig, E., Wahlberg, P., Syvänen, A. C., & Nordlund, J. (2016)(2016). Splinted ligation adapter tagging (splat), a novel library preparation method for whole genome bisulphite sequencing.(全ゲノムバイサルファイトシーケンスのための新規ライブラリー調製法)。 Nucleic Acids Research, 45(6), e36.
  • Ziller, M. J., Müller, F., Liao, J., Zhang, Y., Gu, H., & Bock, C., et al (2011). ヒトの細胞種における非pgメチル化のゲノム分布とサンプル間変動。 Plos Genetics, 7(12), e1002389.
  • * For Research Use Only. 診断には使用できません