Principles and Workflow of Whole Genome Bisulfite Sequencing
Principles of whole genome bisulfite sequencing
Epigenetic studies, confirmed that DNA-methylation modification of specific gene regions played in chromosome conformation and gene expression regulation, the important role of a distant. C5におけるDNAシトシン残基のメチル化(5meC)は多くの真核生物に共通するエピジェネティックマークであり、CpGまたはCpHpG(H=A、T、C)に広く見いだされる。 主にエンドヌクレアーゼ消化、アフィニティー濃縮、バイサルファイト変換の3つのアプローチがある(表1)。 ほぼすべての配列特異的なDNAメチル化解析アプローチは、忠実性を維持するために増幅やハイブリダイゼーションの前にメチル化依存性の処理を行う必要がある。 次世代シーケンス (NGS) などのさまざまな分子生物学的手法は、その後、5meC 残基を検出するために実行される
Table 1. NGSを用いたメチル化解析の主な原理。
酵素消化 |
アフィニティー濃縮 |
バイサルファイトナトリウム |
|
原則 |
Affinity enrichmentは、DNAメチル化のプロファイリングのために5meCまたは親和性のあるメチル結合タンパク質に特異的な抗体を用いる。 | Sodium bisulfiteは化学的に非メチル化シトシンをウラシルに変え、したがってメチル化の検出を可能にする。 | |
方法例 |
Methyl-seq
*MCA-seq *HELP-seq *MSCC |
*MeDIP- | *RRBS
*WGBS *BSPP |
*MCA: methylated CpG island amplification; *HELP: HpaII tiny fragment enrichment by ligation-mediated PCR; *MSCC: methylation-sensitive cut counting; *MeDIP-seq: methylated DNA immunoprecipitation; *MIRA: methylated CpG island recovery assay; *RRBS: reduced representation bisulfite sequencing; *WGBS: whole genome bisulfite sequencing; *BSPP: bisulfite padlock probes.BASPP は、BASPP: メチル化CpGアイランドプローブ。
ビスルファイト変換は1990年代にゲノムのメチル化解析に革命を起こした。 重亜硫酸塩がゲノム中のメチル化されていないシトシンをウラシルに変換し、PCR増幅時にチミンに置き換えることができるため、配列決定後に各位置のシトシンとチミンを数えることにより、もともとメチル化によって修飾されていたシトシンと区別することができる(図1)。 全ゲノムバイサルファイトシーケンス(WGBS)は、この分野で重要な研究手法として、バイサルファイト処理と次世代・第3世代シーケンサー技術(主にショットガンシーケンス)を組み合わせて、ゲノムレベルでのDNAメチル化研究に応用しています
図1. 3583>
全ゲノムバイサルファイトシーケンスの利点
- ゲノム全体のメチル化プロファイリングを1塩基レベルで可能にする
- 遺伝子間の「遺伝子砂漠」、部分メチル化ドメイン、リモート制御要素を含むほぼすべてのCpG座のメチル化状態を評価することができる。
- 絶対的なDNAメチル化レベルとメチル化配列バックグラウンドを明らかにする
全ゲノムバイサルファイトシーケンスのワークフロー
つまり、全ゲノムバイサルファイトシーケンス(WGBS)の基本ステップは、DNA抽出、バイサルファイト変換、ライブラリー準備、配列決定、バイオインフォマティクス解析が含まれます。 ここでは、Illumina HiSeqを例にして、WGBSのワークフローを説明する。
図2. whole genome bisulfite sequencingのワークフロー(Khanna et al. 2013)
- DNA抽出
まず、ヒト、動物、植物または微生物から採取した組織サンプル約1〜5mgをDNAの調製に使用します。 一般に、全ゲノムビスルファイトシーケンスのためのサンプルは、以下の4つの特徴を満たす必要がある。
i. 真核生物;
ii. ハイポメチル化(図3に示すように、ある領域のCpGサイト数が増加すると、WGBSのシーケンスデータは減少し始めるという研究結果が出ている);
iii. 参照ゲノムが少なくともスキャフォールドレベルまで組み立てられている;
iv. ゲノムのアノテーションが比較的完全である。 そして、適切なキットを適用して、高純度・高分子量のDNAを抽出する。 抽出されたDNAは、質量が5μg以上、濃度が50ng/ul以上、OD260/280が1.8〜2.0であることが望ましい
図3. 従来のWGBS技術はメチル化部位のカバー率が低い(Raine et al. 2016)
- Bisulfite Conversion
ビスサルファイト変換はDNAメチル化解析の「ゴールドスタンダード」と考えられており、原理は図4に示したとおりである。 この方法では、BSによるDNAの分解が、メチル化されていないシトシンに富むゲノム領域の枯渇につながる可能性がある。 したがって、反応条件下でのDNA分解量を評価することが重要であり、それが目的のアンプリコンにどのような影響を与えるかも考慮する必要がある。 Olovaら(2018)は、高変性または高ビスルファイトモル比を利用するビスルファイト変換プロトコルでは、DNAの分解が強いことを明らかにした。 市場にはいくつかのキットがある(表2)
Figure 4. シトシンの重亜硫酸塩を介した脱アミノ化 (Hayatsu et al. 2004).
Table 2. Bisulfite変換プロトコルとパラメータ。
キット | 変性 | 変換温度 | 培養時間 |
ジモEZ DNAメチル化ライトニングキット | 熱ベース;99℃ Alkaline-based; 37 ℃ |
65 ℃ | 90 分 |
EpiTect Bisulfite kit (Qiagen) | Heat-based; 99 ℃ | 55 ℃ | 10 時間 |
EZ DNA Methylation Kit (Zymo Research) | Alkaline-based; 37 ℃ | 50 ℃ | 12-16 時間 |
- Library Preparation
EpiGnomeTM Methyl-Seq Kit (Epicentre) を例として(図5に示す)、その説明をします。 重亜硫酸塩処理した一本鎖DNAを、ウラシルヌクレオチドを読み取ることができるポリメラーゼを用いてランダムプライミングし、特定の配列タグを含むDNAを合成する。 このようにして、5’末端と3’末端に既知の配列タグを持つ2つのマーカーDNA分子を得ることができる。 イルミナP7およびP5アダプターは、その後、DNA配列決定の前に、5末端および3末端にPCRで付加されます
図5. EpiGnomeTM Methyl-Seq Kitのワークフロー。
- Sequencing
Hiseqシーケンス技術、SBS(sequencing by synthesis)に基づく新しいシーケンス方法は、WGBSに広く適用されています。 フローセル上でのブリッジ増幅は、1分子アレイを使用することで実現する。 新しい可逆的ブロッキング技術により、一度に1塩基のみを合成し、蛍光体を標識することができるため、対応するレーザーで蛍光体を励起し、その励起光を取り込んで塩基情報を読み取ることができる。 WGBSでは、250-300 bpの挿入型バイサルファイト処理DNAライブラリーのシーケンスに、ペアエンド150 bp戦略が一般的に採用される。
- Data Analysis
シーケンス結果に対して一連の解析を実施することができます。 主な情報解析の種類を表3に示す。 さらに、メチル化密度解析、DMR(Differentially Methylated Region)解析、DMRアノテーション・濃縮解析(GO/KEGG)、クラスタリング解析も行うことができる。 WGBSの共通バイオインフォマティクスリソースとしては、BDPC、CpGcluster、CpGFinder、Epinexus、MethTools、mPod、QUMA、TCGA Data Portalがある
表3.表3.表3. WGBSデータ解析の主な種類
種類 | 詳細 |
参照ゲノムに対するアライメント | SOAPソフトなどのツールを用いてリードを参照ゲノム配列と比較し、アライメントしたリードのみをメチル化情報解析に使用する。 C-CマッチとC-Tミスマッチを許容するリードをアラインする。 |
mC calling | ゲノム全体のmC位置を決定する。mC比率はリード品質と多座マッピング確率を考慮して計算される。 アライメントの信頼性が低い確率の低いアライメントは破棄する。 |
配列深度とカバー率解析 | 遺伝子カバー率と配列深度の関係を反映した画像により、特定の塩基位置で一定の信頼性をもってメチル化発見ができるかどうかを判断する。 |
メチル化レベル解析 | 各メチル化C塩基のメチル化レベルは、下記の計算方法で算出する。 100*reads/total reads。 ゲノム全体の平均メチル化レベルは、ゲノムメチル化プロファイルの全体的な特徴を反映する。 |
メチロームのグローバルトレンド | メチル化C塩基におけるCG、CHGG、CHHの分布比は、特定の種の全ゲノムメチル化マップの特徴をある程度反映している。 |
注目のサービス:
Whole genome bisulfite sequencing
Targeted bisulfite sequencing
ChIP-seq
Reduced Representation Bisulfite Sequencing
。