Articles

The genome of platyfish, Xiphophorus maculatus, provides insights into evolutionary adaptation and several complex traits

兄弟・姉妹連続交配の104世代目の単一カモノハシの雌(XX、2n=46染色体、Jp163A系統;図1)の全ゲノム配列を決定しました。 全塩基配列のカバー率は19.6倍(補足注)であり、N50コンティグ長22kb、スーパーコンティグ長1.1Mbのアセンブリが得られた(補足表1)。 アセンブリエラーは、ほとんどが1塩基の挿入または欠失であり、イルミナペアエンドリードを用いて修正された。 推定ゲノム長750-950 Mbのうち、合計669 Mbがコンティグとして組み上げられた。 遺伝子予測により、20,366のコーディング遺伝子、348の非コーディング遺伝子、28の偽遺伝子が同定された(補足)。

Figure 1: プラティフィッシュ(X. maculatus)。
figure1

(a) X染色体癌遺伝子の活性を適切に制御すると背びれに黒い色素斑ができるJp163A株の雌(上)および雄(下)カモノハシ。 ハイブリッド遺伝子型では、この制御がうまくいかず、斑点から悪性黒色腫が発生する。 (b)他の魚類に対するカモノハシの系統的位置づけ

他のテレオストと同様に、カモノハシのトランスポゾーム(TE)は非常に多様で、哺乳類1や鳥類にはない多くのファミリーを含んでいた(補図1〜3、補表2、3、補注)。 その結果、トランスクリプトームの4.8%が約40の異なるファミリーを代表するTE配列に由来しており、カモノハシのTEの多くが現在も活性を保っている可能性が高いことが分かりました。 最も活性の高いTEはTc1 DNAトランスポゾン(>16,000コピー)であり、次いでRTEファミリー(>9,000コピー)であった。 特に、泡状レトロウイルス(Spumaviridae)のエンベロープがほぼ完全にコピーされた状態でカモノハシゲノムに組み込まれていることが確認された(図2)。 泡状ウイルスは、哺乳類における外来性の感染因子として知られている2。 最近になって、哺乳類のナマケモノ3やアイアイ4、シーラカンス5などのゲノムに、感染症の化石記録を表すと思われる内因性泡状ウイルス配列が記載されるようになった。 ゼブラフィッシュの泡状ウイルス様配列6、本研究で発見されたタラの配列、今回報告されたカモノハシゲノム配列は、さらに広い範囲の宿主を示すものである。 泡状ウイルスの分子系統は、宿主の系統と一致している(図2)。 この結果は、この種のウイルスが古くから海洋で進化的に誕生し、宿主とウイルスが共進化した可能性があるという考え方を支持するものである5。 また、魚類のゲノムに含まれる泡状ウイルスは、他の魚類のゲノムには存在せず、ほぼ無傷であることから、感染によって生殖細胞系列に独立した形で導入された可能性がある。 外因性の泡状ウイルスは魚類では報告されていなかったが、我々の結果は外因性の泡状ウイルスが魚類の系統に感染したことがあり、現在も感染している可能性を示唆している。

図2:逆転写酵素タンパク質配列に基づく内因性レトロウイルスの系統樹
figure2

フォアミーウイルス(FV)配列(水色の網掛け)は、四肢に特異的なものと望遠に特異的なものとで、2つの明確な系統群を形成している。 両グループとも内因性の泡状ウイルス(EFV)配列を含む(新たに同定されたプラティフィッシュとタラの配列は濃紺の網掛けで強調されている)。 アラインメントはClustalW(223アミノ酸)で行い、系統樹はPhyMLパッケージで最尤法38を用いて、デフォルトのブートストラップ(枝の最初に表示)および最適化した計算オプションで構築した。 FV、泡状ウイルス;MuERV-L、Mus musculus endogenous retrovirus-L;BAEV、baboon endogenous virus;FENV1、feline endogenous virus 1;EFV、endogenous foamy virus;MLV 、murine leukemia virus;HERV-K 、human endogenous retrovirus-K;MMTV 、mouse mammary tumor virus;HIV-1, human immunodeficiency virus-1.の各ウイルス。 5998>

哺乳類の染色体相同性マップは、平均で約35の大きな保存シンテニーブロック(ただしイヌでは約80、マウスでは200)と多数の小さなブロックが、様々な種間で異なる組み合わせで集合し、9000万年を超える進化にわたってパッチワーク状に配置されていることを示す7。 私たちは、脊椎動物の中で最も広範な減数分裂遺伝地図を作成し、X. maculatusのスキャフォールドの順序付けと魚類ゲノムの比較による保存シンテニー解析が可能になりました(補遺)。 我々は革新的な制限部位関連DNA(RAD)タグ法8を用いて、カモノハシのハプロイド染色体数に相当する24の連鎖群を定義する16,245個の多型マーカーからなる減数分裂地図を構築した9。 その結果、コンティグに含まれる全配列の90.17%が染色体上の位置を特定することができた。 また、遺伝子の並び順を種間で長距離比較した結果10、カモノハシと他の魚類の染色体との間に新たな進化的関係があることが判明した。 ゲノムが解読された最も近い近縁種であるメダカも24本の染色体を持ち、そのうち19本はカモノハシ染色体と厳密に一対一の関係を示した(図3a,b)。 残りの5本のカモノハシ染色体も、1〜2本の短い部分(長さ約1Mb)が別のメダカ染色体上にある以外は、それぞれ1本のメダカ染色体にオーソログでした(図3c、補足図4)。 このように、1億2000万年前にメダカとカモノハシが分岐して以来、非常に多くの転座(すべて非常に短い)が核型を破壊してきたのである11,12。 また、カモノハシの染色体を1億8000万年前に分岐したハリヨの染色体と比較したところ、同様の図式が浮かび上がってきた11,12。 これは、哺乳類の約半分の進化期間よりもはるかに長い保存期間である7,11,12。 なぜなら、TGDによって生じたパラロガス染色体の不正な対合は転座を促進すると考えられていたからである。 5998>

図3:カモノハシとメダカの間で保存されているシンテニー
figure3

(a) X.A.上の遺伝子のメダカオルソログはメダカの遺伝子と同じである. maculatusの9番染色体(Xma9)のメダカの遺伝子はOryzias latipesの4番染色体(Ola4)上にある傾向があり、これらの種の系統が分岐してからの1億2000万年の間に転座がなく、これらの染色体の遺伝子内容がそのまま残っていることを示している。 Xma9と書かれた横軸に沿った灰色の点は、メダカのオルソログ(相互ベストBLASTヒット解析により判定)がXma9遺伝子に直接垂直な位置にあるカモノハシ遺伝子の位置を表し、適切なメダカ染色体10上にプロットされている。 (b) メダカ染色体Ola4上の遺伝子のほぼ全てのカモノハシオルソログがXma9上に存在する。 (c)Xma19のほぼ全てのメダカのオルソログは、Ola22上の20Mbの位置にある約1Mbの長さのセグメントがOla24上に現れる(破線枠)以外は、Ola22上にある。

プラティフィッシュは癌研究における有名なモデルである13。 そのゲノムには、メラノーマ発生の引き金となる癌遺伝子xmrk14を含む腫瘍制御領域(TCR)が存在する。 TCRには腫瘍修飾因子mdl15,16も含まれており、mdlの対立遺伝子変異は、腫瘍の体内区画、発症時期、重症度を制御している17。 さらに、mdl対立遺伝子は、遺伝的に定義された高い多様性の色素パターンとしてカモノハシに発現している。 マッピングされたゲノムのおかげで、これらの性関連色素変異やメラノーマ修飾因子の責任因子として多くの色素遺伝子を除外することができました。 既知の色素遺伝子18 はすべて XX メスのカモノハシゲノムに存在した。したがって、Y 染色体特異的なものはない。 174の既知の色素遺伝子のうち6つ(asip2a, egfrb, muted, myca, rps20, tfap2a)だけがX染色体(Xma21)上に存在した。 これらの6つのうち、原腫瘍遺伝子efrbだけが、メラノーマ腫瘍遺伝子xmrk(補足表4)と十分に近い位置に存在し、mdlの候補遺伝子と考えられた。 実際、生化学的研究により、EgfrbはXmrkと協調できることが示されているが19、これらの遺伝子の発現レベルはメラノーマでは逆に制御されている20。 egfrbの機能を評価し、このゲノム領域で色素パターンとメラノーマの表現型の両方を制御していると考えられる他の非古典的色素形成遺伝子候補を見つけるためにさらなる研究が必要である。

Xiphophorusメラノーマモデルで今のところ未確認のもう一つの遺伝子構成要素はR/Diff遺伝子である。 R/Diffは野生のカモノハシでメラノーマ形成を抑制し、種間ハイブリダイゼーションによるその発現の排除は腫瘍の成長を可能にする。 R/DiffはXma5上のcdkn2a/b遺伝子座に近い10cmの区間にマッピングされた21。 相同遺伝子であるヒトCDKN2Aは特定のヒトメラノーマにおいてよく知られている腫瘍抑制遺伝子であるにもかかわらず22、cdkn2a/bは変異しておらず、代わりにXiphophorusメラノーマモデルにおいて過剰発現しているのでR/Diffから除外された23。 Xma5の配列は、現在、さらなる探索のための多くのR/Diff候補遺伝子を定義している。 例えば、cdkn2a/bを持つscaffold 182 (1,085,500 bp)には、R/Diff腫瘍抑制因子としての役割を持つ可能性の高いいくつかの遺伝子(例えば、tet2、cxxc4、mtap、tpo-rs、mdx4、pdcd4aなど)が含まれている。 あるいは、この領域は、xmrk癌遺伝子を制御するために相乗的あるいは代償的に作用するいくつかの遺伝子からなる複合遺伝子座を示しているのかもしれない。これは、多くのXiphophorus種間雑種腫瘍モデルにおける自然発癌および誘発発癌の過去の報告24、25、26と一致する。

胎生とは、受精前に卵を完全に供給し発生まで保持するものから、哺乳類のように受精前に卵を最低限供給し受精後に胎盤を介して供給するものまで、子孫に対する多様なレベルの母親の投資を伴う精巧な生殖様式である。 魚類のPoeciliidaeは260種以上からなる単系統群であるが27、受精後の供給がごくわずかな種から大規模な種まで含まれるのは珍しいことである28,29。 哺乳類以外の胎生脊椎動物からのゲノムは、カモノハシが初めてである。 我々は、カモノハシと、受精前に卵を十分に提供する第二の胎生魚であるソードテイルXiphophorus helleriiを用い、4種の産卵魚類(メダカ、テトラオドン、ハリヨ、ゼブラフィッシュ)と比較して、3群の胎生遺伝子(卵黄、胎盤、卵被膜遺伝子;n = 34)の遺伝子損失と正の選択について解析を行った。

哺乳類では、胎生期の上昇にはビテロジェニン(卵黄前駆体)の漸減が関与していることが提唱されている32。 扁平魚およびソードテールでは、すべての卵黄関連遺伝子(ビテロジェニンおよびそのトランスポーター/レセプター;補足表5)が存在し、浄化選択下で進化しており、両種が受精前に卵を完全に供給することと一致していたが、正の選択下で進化した一つの遺伝子、ビテロジェニン1(補足図5)を除いては(補足表5)、卵黄の供給は行われていなかった。 5a)。

哺乳類のオルソログが胎盤の発達に関係する13のプラティフィッシュ遺伝子のうち、3つが正の選択下で進化した(図4a、補足図5b-d、補足表5)。 マウスで胎盤透過性を制御しているIgf233は、カモノハシでは強い正の選択を受けて進化し(図4a)、特にタンパク質分解部位から遠位の領域に影響を及ぼしていた。 igf2の配列33は、もう一種のポエシリッドであるデザートトップミノーPoeciliopsis lucidaからも入手できた。この種はXiphophorus種と生殖祖先を共有するが、胎盤形成が最近進化した点で異なっている。 デザートトップミノーでは、カモノハシと同じ領域が正の選択を受けて進化したが、その選択はさらに強く(補足図5b)、これらの魚を含む2つの属が数百万年前に分岐して以来、分子的適応進化が進行していることが示唆された。 他の2つの胎盤遺伝子、ppargとncoa6では、既知の機能領域以外に正の選択のシグナルを持つ領域が複数あり、胎生に重要な新規領域であることが示唆された。 しかし、産卵期のカモノハシや有袋類、胎盤性哺乳類の遺伝子を解析したところ、胎生期の魚で選択されている同じ遺伝子は正の選択のシグナルを示さなかった(補足表6)。 この結果は、哺乳類と魚類の胎盤は収斂的な構造であるが、相同的な構造ではないことと一致する。

図4:ベイズ経験ベイズ解析により算出した各アミノ酸部位に対する遺伝子に沿って代替モデルでの部位クラスの事後確率を示す。
figure4

Xiphophorus種ではクラス1部位が浄化選択(Ka/Ks比∼0)、クラス2部位が中立選択(Ka/Ks比∼1)、クラス3部位が正の選択下にあることがわかる。 (a) インスリン様成長因子2(IGF2)。 プロット下の色のついた棒は既知の機能ドメインを示し、矢印はタンパク質分解部位(残基118と119の間)を示している。 (b)チョリオジェニンHマイナー。 上図、産卵魚と生魚の比較。 下は胎盤のある哺乳類とない哺乳類の比較。 魚類と哺乳類で同じ領域が正の選択を受けている。

Zona pellucida (Zpc) 遺伝子は、卵子形質膜を取り巻く糖タンパク質に富む被膜を作り出すが、最も顕著な変化を示した。アルベオリンはカモノハシゲノムから失われてしまった。 逆に、コリオジェニンHマイナー、コリオリジンL、コリオリジンH、zvepは正の選択下で進化した(図4b、補足図5e-g、補足表5)。 Xenopus laevisでは、Zpc遺伝子は種特異的な精子結合を制御し、水環境中に放出された同種の精子のみが卵を受精させるのに役立っている34。 しかし、胎生魚は体内受精を行うため、種特異的な精子の認識はそれほど重要ではないと思われる。 産卵魚と比較して、これらの魚の卵殻は、もはや保護に必須ではなく、ガスや物質の交換を促進しなければならないため、母体内での発達に適応していると予想される。 孵化酵素遺伝子zvepとchoriolysinHは、一般に触媒ドメインに隣接した場所に高速進化を示した(補足図4f、g)。これは、胎生期の進化の過程で、これらの酵素が標的タンパク質や調節タンパク質との相互作用を変化させた可能性を示している。 特に、コリオジェニンHマイナーでは、哺乳類と魚類の両方で、同じ領域、特に透明帯ドメインが正の選択を受けて進化している(図4b)。 これは、分子レベルでの収斂進化が生理学的、ひいては形態学的なレベルでどのように現れるかを示す顕著な例である。

TGDの結果の分析により、私たちはある遺伝子群の機能を発見したが、それは特に西方魚や一般に望遠魚が、両生類や爬虫類など他の「冷血」脊椎動物群が達成できない顕著で高レベルな行動の複雑さを示すことから興味を持たれた35。 カモノハシゲノムと他の6種の遺伝子アノテーションを用いて、TGDイベントによる遺伝子の重複保持が、サブファンクショナル化(祖先のサブファンクションの差分保持)36およびネオファンクショナル化(新しいサブファンクションの獲得)36を通じて、より複雑な行動の獲得につながるかどうかを検討しました。 190の認知関連遺伝子(補足表7、補足注)を、対照として色素形成に関わる遺伝子(133遺伝子、この遺伝子レパートリーの増加がテレオスト色彩の高い複雑性と多様性に関係している)および肝機能に関わる遺伝子(187遺伝子)18と比較検討した。 認知関連遺伝子の解析では、色素形成に関わる遺伝子(30%)、肝機能に関わる遺伝子(15%)に比べ、カモノハシでは45%と高い重複保持率を示し、他獣類でも同様の値を示した(図5、補足図6)。 また、テレストゲノムにおける全遺伝子の平均重複保持率は12-24%と推定されている(ref. 37)。 TGD後に保持された3つの機能カテゴリー(認知、色素形成、肝機能)の遺伝子には、投与量感受性やタンパク質複合体メンバーによる偏りは見られなかったが(補足表8、9、補足注)、認知遺伝子(肝機能、色素形成遺伝子は除く)には特に大きなタンパク質(<5666>1000アミノ酸長)に対して偏りが見られた(補足図7、補足表10、補足注)。 遺伝子損失を系統樹にプロットすると、認知遺伝子の保持はTGDの直後からテレオスト多様化の前にすでに固定化されていることがわかった。 この発見は、TGDイベントからのパラログ保持がXiphophorusや他のテレオストの高度な行動の複雑さを支えてきたかもしれないという仮説を支持するものである。

図5:TGD後のテレオストの認識、色素形成、肝臓機能クラスにおける遺伝子重複の保持の差違。
figure5

(a) 7つのテレオストゲノムにおける認知、色素形成、肝機能に関連する遺伝子のTGD由来の重複の保持率。 Xiphophorusにつながる系統を含むテレオスト進化中の時点を線で結んだ。 (b)認知関連遺伝子190組の重複遺伝子について、TGD後の遺伝子欠損を系統的にマッピングした。 損失は負の値で示される。 括弧内は、各テレオストゲノムについて保持されたTGDパラログ対の数を示す。 TGDパラログの損失は、Setiamargaら39が提供するテレスト系統に、パーシモン原理に従ってマッピングされた。 TGDイベントは3億5千万年前に設定された。 TGDパラログの保持率は、特定の系統に存在するTGD由来の重複のペア数を、TGD18の時点で存在したTGD由来の重複のペア数で割った値で定義される。

プラティフィッシュのゲノム配列と解析により、生殖様式、色素パターンの変化、作用する性染色体進化、複雑な行動、自然発癌と誘発発癌など、このモデル魚のいくつかの顕著な特徴について新しい展望が得られた17. 現存する魚類の中では、魚類が圧倒的に多く、その中でも、カモノハシ、ソードテール、グッピー、モーリーなどのポエシリ科は、この幅広い適応のパラダイムである(図1b)。 また、メラノーマや他の分離型表現型の研究を進める上で重要なリソースを提供する。