Articles

A platyfish, Xiphophorus maculatus genomja betekintést nyújt az evolúciós alkalmazkodásba és számos komplex tulajdonságba

Egyetlen platyfish nőstény (XX, 2n = 46 kromoszóma, Jp163A törzs; 1. ábra) teljes genomját szekvenáltuk a 104. generációs folyamatos testvérpárzásból. A 19,6-szoros teljes szekvencia-lefedettség (Kiegészítő megjegyzés) 22 kb és 1,1 Mb hosszúságú N50 kontig és szuperkontig összeállításokat eredményezett (Kiegészítő 1. táblázat). Az összeszerelési hibákat, főként az egynukleotid-behelyezéseket vagy -eltávolításokat Illumina párosított végű leolvasásokkal korrigáltuk. A 750-950 Mb becsült genomhosszúságból összesen 669 Mb-ot állítottak össze kontigmákba. A génpredikciók 20 366 kódoló gént, 348 nem kódoló gént és 28 pszeudogént azonosítottak (kiegészítő jegyzet).

1. ábra: A platyfish, X. maculatus.
figure1

(a) A Jp163A törzsből származó nőstény (fent) és hím (lent) platyhal a hátúszóján fekete pigmentfoltokkal, amelyek egy X-kromoszómális onkogén aktivitásának megfelelő szabályozása esetén alakulnak ki. A hibrid genotípusokban ez a kontroll sérül, és a foltokból rosszindulatú melanoma alakul ki. (b) A lemezeshal filogenetikai helyzete más halfajokhoz viszonyítva.

A többi teleoszthalhoz hasonlóan a lemezeshalban is rendkívül változatosak voltak a transzponálható elemek (TE-k), köztük számos olyan család, amely az emlősökben1 és a madarakban hiányzik (1-3. kiegészítő ábra, 2. és 3. kiegészítő táblázat és kiegészítő megjegyzés). Azt találtuk, hogy a transzkriptom 4,8%-a mintegy 40 különböző családot képviselő TE-szekvenciákból származik, ami azt jelzi, hogy a platyfish TE-k közül sok valószínűleg még mindig aktív. A legaktívabb TE-k a Tc1 DNS-transzpozonok voltak (>16 000 példány), őket követte az RTE család (>9 000 példány). Figyelemre méltó, hogy egy habos retrovírus (Spumaviridae) több, a platyfish genomjába integrált, majdnem érintetlen burkot kódoló kópiáját azonosítottuk (2. ábra). A habos vírusok exogén fertőző ágensként ismertek az emlősökben2. Csak a közelmúltban írtak le endogén habos vírusszekvenciákat, amelyek a fertőzések fosszilis emlékeit képviselhetik, az emlősök közül a lajhár3 és az aye-aye4 genomjában, valamint a coelacanth5 genomjában. Egy zebrahalban6 található habos vírusszerű szekvencia, egy e munka során felfedezett tőkehalban található szekvencia és az itt közölt platyfish genomszekvencia a gazdaszervezetek még szélesebb spektrumát mutatja. A habos vírusok molekuláris filogeniája összhangban van a gazdafilogeniával (2. ábra). Ez az eredmény alátámasztja az ilyen típusú vírusok ősi tengeri evolúciós eredetének elképzelését, lehetséges gazdavírus-vírus koevolúcióval5. A foamy-vírus néhány eltérő halfaj genomjában talált, más szekvenált halgenomokból hiányzó, majdnem ép kópiái független, fertőzés útján történő csíravonal-bevezetésre utalhatnak. Exogén foamy vírust eddig nem írtak le halakban; eredményeink azonban arra utalnak, hogy exogén foamy vírusok fertőzőképesek voltak és lehetnek a halak vonalában.

2. ábra: Az endogén retrovírusok filogenetikai fája a reverz transzkriptáz fehérje szekvenciák alapján.
figure2

A foamy vírus (FV) szekvenciái (világoskék árnyékolás) két különálló filogenetikai csoportot alkotnak, egy tetrapoda-specifikusat és egy teleoszt-specifikusat. Mindkét csoport tartalmaz endogén habos vírus (EFV) szekvenciákat (az ewly azonosított platyfish és tőkehal szekvenciákat sötétkék árnyékolással emeltük ki). Az illesztést a ClustalW programmal végeztük (223 aminosav), a filogenetikai fát pedig a PhyML csomaggal építettük fel maximum-likelihood módszerrel38 , alapértelmezett bootstrap (az ágak elején látható) és optimalizált számítási opciókkal. FV, habos vírus; MuERV-L, Mus musculus endogén retrovírus-L; BAEV, pávián endogén vírus; FENV1, macska endogén vírus 1; EFV, endogén habos vírus, MLV, egér leukémiavírus; HERV-K, humán endogén retrovírus-K; MMTV, egér emlőtumor vírus; HIV-1, humán immunhiány vírus-1. A skálasáv a helyenkénti szubsztitúciók számát jelöli.

Az emlősök kromoszóma-homológiatérképei átlagosan körülbelül 35 nagy konzervált syntenyblokk (de a kutyában körülbelül 80, az egérben 200) és számos kisebb blokk patchwork elrendezését mutatják, amelyek a különböző fajok között különböző kombinációkban álltak össze, és több mint 90 millió évnyi evolúciót ölelnek fel7. Megkonstruáltuk a gerincesek eddig publikált legkiterjedtebb meiotikus genetikai térképét, amely lehetővé tette a X. maculatus vázak rendezését és a halak genomjait összehasonlítva a konzervált szύνtenia pontos elemzését (Kiegészítő megjegyzés). Az innovatív restrikciós hely-asszociált DNS (RAD)-tag megközelítést8 alkalmaztuk a 16 245 polimorf markerből álló meiotikus térkép megalkotásához, amely 24, a platyhal haploid kromoszómaszámának megfelelő kapcsolati csoportot határoz meg9. Így a kontigok összes szekvenciájának 90,17%-a kromoszómális pozícióhoz volt rendelhető. A gének sorrendjének fajok közötti hosszú távú összehasonlítása10 új evolúciós kapcsolatokat azonosított a lemezeshalak és más teleoszthalak kromoszómái között. A Medaka, a szekvenált genommal rendelkező legközelebbi rokon, szintén 24 kromoszómával rendelkezik, és ezek közül 19 mutatott szigorú egy az egyben kapcsolatot a tintahal kromoszómáival (3a,b ábra). A fennmaradó öt platyfish-kromoszóma szintén mindegyike ortológ volt egyetlen medaka-kromoszómával, egy-két rövid (∼1 Mb hosszúságú) szegmens kivételével, amelyek egy másik medaka-kromoszómán helyezkedtek el (3c. ábra és 4. kiegészítő ábra). Így a medaka és a platyfish 120 millió évvel ezelőtti divergenciája óta meglehetősen sok, mind nagyon rövid transzlokáció bontotta meg a kariotípust11,12 . Hasonló kép rajzolódott ki a lemezeshalak kromoszómáinak a botcsinálta kromoszómákkal való összehasonlításából (eltérés 180 millió évvel ezelőtt)11,12 . Ezek az eredmények részletesen bemutatják, hogy a kromoszómák genetikai tartalma az evolúció közel 200 millió éve alatt milyen széles körben konzerválódott ezekben a teleostokban, ami sokkal nagyobb mértékű, mint az emlősöknél tapasztalt, körülbelül feleannyi idő alatt tapasztalt konzerválódás7,11,12 . Ez némileg váratlan, tekintettel a teleoszt genomduplikációs (TGD) eseményre, mert azt gondolhattuk volna, hogy a paralóg kromoszómák törvénytelen párosítása (a TGD következtében) megkönnyítheti a transzlokációkat. Az ilyen transzlokációkat esetleg mérséklő mechanizmusok továbbra sem ismertek.

3. ábra: Konzervált szinonimák a platyfish és a medaka között.
figure3

(a) Az X-en lévő gének medaka ortológjai. maculatus 9-es kromoszómáján (Xma9) található gének általában az Oryzias latipes 4-es kromoszómáján (Ola4) helyezkednek el, ami azt mutatja, hogy e kromoszómák génállománya érintetlen maradt, és nem történt transzlokáció az e fajok vonalainak szétválása óta eltelt 120 millió év alatt. Az Xma9 feliratú vízszintes tengely mentén minden egyes szürke pont egy olyan lemezeshal-gén pozícióját jelöli, amelynek medaka ortológja (a reciprok best-BLAST találatelemzés alapján) közvetlenül az Xma9 génre függőlegesen helyezkedik el, a megfelelő medaka kromoszómán10 ábrázolva. (b) Reciprok módon a medaka Ola4 kromoszómáján lévő gének szinte valamennyi platyfish ortológja az Xma9-en fekszik. (c) Az Xma19 medakai ortológjainak majdnem mindegyike az Ola22 kromoszómán található, kivéve egy körülbelül 1 Mb hosszúságú szegmenst az Ola22 20 Mb pozíciójában, amely az Ola24 kromoszómán jelenik meg (szaggatott doboz).

A platyhal a rákkutatás jól ismert modellje13. Genomja tumorkontroll régiót (TCR) tartalmaz, beleértve a melanoma kialakulását kiváltó onkogén xmrk14 -t is. A TCR tartalmazza a tumormodifikátor mdl-t is15,16. Az mdl allélváltozatai szabályozzák a tumorok testrészét, kialakulásának idejét és súlyosságát17. Ezenkívül az mdl allélok a lemezeshalakban a genetikailag meghatározott pigmentmintázatok nagy változatosságában nyilvánulnak meg. A feltérképezett genom lehetővé tette számunkra, hogy kizárjunk számos pigmentgént, mint ezen nemhez kapcsolódó pigmentvariánsok és melanoma-módosítók felelős tényezőit. Az összes ismert pigmentgén18 jelen volt a XX nőstény platyfish genomjában; tehát egyik sem Y-kromoszómaspecifikus. A 174 ismert pigmentgénből csak 6 (asip2a, egfrb, muted, myca, rps20 és tfap2a) helyezkedett el az X kromoszómán (Xma21). E hat közül csak az egfrb proto-onkogén helyezkedett el elég közel az xmrk melanoma onkogénhez (4. kiegészítő táblázat) ahhoz, hogy az mdl jelölt génjének tekinthessük. Valóban, biokémiai vizsgálatok kimutatták, hogy az egfrb együttműködhet az xmrkkel19 , de e gének expressziós szintje melanomában fordítottan szabályozott20. További vizsgálatokra van szükség az egfrb funkciójának értékeléséhez és más, nem klasszikus pigmentációs génjelöltek felkutatásához ebben a genomiális régióban, amelyek mind a pigmentmintázatot, mind a melanoma fenotípust szabályozhatják.

A Xiphophorus melanomamodell másik, eddig nem azonosított genetikai összetevője az R/Diff gén. Az R/Diff elnyomja a melanoma kialakulását a vad platyhalakban, és az expressziójának fajok közötti hibridizációval történő megszüntetése lehetővé teszi a tumor növekedését. Az R/Diff-et az Xma5 egy 10 cm-es intervallumára térképeztük fel a cdkn2a/b lókusz közelében21. Annak ellenére, hogy az ortológ humán CDKN2A gén jól leírt tumorszuppresszor gén bizonyos humán melanomákban22 , a cdkn2a/b-t kizártuk az R/Diff-ből, mivel nem mutálódik, hanem a Xiphophorus melanoma modellben túlreprezentálódik23. Az Xma5 szekvencia most számos R/Diff jelölt gént határoz meg további vizsgálatra. Például a cdkn2a/b-t tartalmazó 182. szekvencia (1 085 500 bp) számos olyan gént tartalmaz, amelyek nagy valószínűséggel R/Diff tumorszuppresszorként játszhatnak szerepet (például tet2, cxxc4, mtap, topo-rs, mdx4 és pdcd4a). Alternatív megoldásként a régió egy komplex lókuszt képviselhet, amely több olyan gént tartalmaz, amelyek szinergista vagy kompenzáló módon hatnak az xmrk onkogén szabályozására, összhangban a számos Xiphophorus fajok közötti hibrid tumormodellben a spontán és indukált karcinogenezisről szóló korábbi jelentésekkel24,25,26 .

A viviparitás egy bonyolult szaporodási mód, amely az utódokba való anyai befektetés különböző szintjeit foglalja magában, a megtermékenyítés előtti teljes ellátástól kezdve a petesejtek megtermékenyítés előtti teljes ellátásától és a fejlődés során való megtartásukig, a megtermékenyítés előtti minimális ellátástól kezdve a megtermékenyítés után a placentán keresztül történő ellátásig, mint az emlősöknél. A halak családja, a Poeciliidae, egy több mint 260 fajból álló monofiletikus klád27 , szokatlan módon olyan fajokat tartalmaz, amelyek az elhanyagolhatótól a megtermékenyítés utáni kiterjedt táplálkozásig terjedő spektrumot ölelik fel28,29 . A lepényhal genomja az első nem emlős, élősködő gerincesektől származó genom. A platyfishben, valamint egy másik élveszülető halban, a kardfarkú Xiphophorus hellerii halban – mindkettőnek jól ellátott ikrája van a megtermékenyítés előtt30,31 – a viviparitás génjeinek 3 csoportját (sárgája, placentája és ikrahéj génjei; n = 34) elemeztük génvesztés és pozitív szelekció szempontjából, összehasonlítva 4 tojásrakó teleost-fajjal (medaka, tetraodon, stickleback és zebrahal).

Az emlősöknél a viviparitás kialakulását a vitellogeninek (sárgatest-előanyagok) fokozatos elvesztésével javasolták32. A lemezeshalakban és a kardszárnyúakban az összes sárgájával kapcsolatos gén (vitellogeninek és transzportereik/receptoraik; Kiegészítő 5. táblázat) jelen volt és tisztító szelekció alatt fejlődött, ami összhangban van azzal, hogy mindkét faj teljes mértékben ellátja a petéket a megtermékenyítés előtt, kivéve egy gént, amely pozitív szelekció alatt fejlődött, a vitellogenin1-et (Kiegészítő ábra. 5a).

A 13 platyfish-gén közül három, amelyek emlős ortológjai a méhlepény fejlődéséhez kapcsolódnak, pozitív szelekció alatt fejlődött (4a. ábra, 5b-d. kiegészítő ábra és 5. kiegészítő táblázat). Az Igf2, amely az egérben a méhlepény áteresztőképességét szabályozza33 , erős pozitív szelekció alatt fejlődött a tintahalakban (4a. ábra), amely különösen a proteolízis helyétől távoli régiót érintette. Az igf2 szekvencia33 egy másik poeciliidából, a Poeciliopsis lucida nevű sivatagi topminnow-ból is rendelkezésre állt, amely osztozik a Xiphophorus fajokkal az élveszülető ősökön, de abban különbözik, hogy a placentáció nemrégiben alakult ki. A sivatagi topminnowban ugyanaz a régió fejlődött pozitív szelekció alatt, mint a pléhhalakban, de a szelekció még erősebb volt (5b. kiegészítő ábra), ami arra utal, hogy a két, e halakat tartalmazó nemzetség több millió évvel ezelőtti szétválása óta folyamatos molekuláris adaptív evolúció zajlik. A két másik placenta gén, a pparg és az ncoa6 több olyan régiót is tartalmazott, amelyek az ismert funkcionális tartományokon kívül pozitív szelekciót jeleztek, ami az élővilág szempontjából fontos új régiókra utal. Ugyanezek a gének azonban, amelyek az élveszülető halakban szelekció alatt állnak, nem mutattak pozitív szelekciós jeleket, amikor ortológ géneket elemeztünk a tojást tojó platypusból, valamint erszényesekből és placentáris emlősökből (6. kiegészítő táblázat). Ez az eredmény összhangban van azzal, hogy az emlősök és a halak placentája konvergens, de nem homológ struktúra.

4. ábra: Az alternatív modellek szerinti helyosztályok poszterior valószínűségei a gén mentén minden egyes aminosavhelyre a Bayes-féle empirikus Bayes-elemzéssel számítva.
figure4

Az 1. osztályú helyek tisztító szelekció (Ka/Ks arány ∼0), a 2. osztályú helyek semleges szelekció (Ka/Ks arány ∼1), a 3. osztályú helyek pedig pozitív szelekció alatt állnak a Xiphophorus fajokban. (a) Inzulinszerű növekedési faktor 2 (IGF2). Az ábra alatti színes sávok az ismert funkcionális doméneket mutatják, a nyíl pedig a proteolízis helyét (a 118. és 119. maradék között). (b) ChoriogeninH minor. Fent, az ikrázó és az élve született halak összehasonlítása. Alul, placentás és nem placentás emlősök összehasonlítása. Ugyanazok a régiók állnak pozitív szelekció alatt a halakban és az emlősökben.

A zona pellucida (Zpc) gének, amelyek a petesejt plazmamembránját körülvevő glikoproteinben gazdag burokot termelik, mutatták a legkifejezettebb változásokat. alveolin eltűnt a lepényhal genomjából. Ezzel szemben a choriogeninH minor, a choriolysinL, a choriolysinH és a zvep pozitív szelekció hatására fejlődött (4b. ábra, 5e-g. kiegészítő ábra és 5. kiegészítő táblázat). A Xenopus laevisban a Zpc gének szabályozzák a fajspecifikus spermakötődést, és segítenek biztosítani, hogy csak a vizes környezetbe kibocsátott konzpecifikus spermiumok termékenyítsék meg a petéket34. Az élősködő halak azonban belső megtermékenyítéssel rendelkeznek, ahol a fajspecifikus spermiumfelismerés nem lenne olyan döntő fontosságú. Az ikrázó halakhoz képest ezekben a halakban az ikrahéj várhatóan alkalmazkodott az anyán belüli fejlődéshez, mivel már nem a védelemhez szükséges, hanem a gáz- és anyagcserét kell elősegítenie. A zvep és a choriolysinH keltető enzimgének általában a katalitikus domének mellett elhelyezkedő gyors evolúciós helyeket mutattak (4f,g kiegészítő ábra), ami arra utal, hogy az élősködés evolúciója során ezek az enzimek megváltoztathatták a cél- vagy szabályozó fehérjékkel való kölcsönhatásaikat. Figyelemre méltó, hogy a choriogeninH minorban ugyanazok a régiók, különösen a zona pellucida doménben, pozitív szelekció alatt fejlődtek ki mind az emlősökben, mind a halakban (4b. ábra). Ez egy figyelemre méltó példa arra, hogy a molekuláris szintű konvergens evolúció hogyan nyilvánul meg a fiziológiai és végül a morfológiai szinten.

A TGD következményeinek elemzései a gének egy olyan funkcionális osztályát tárták fel, amely felkeltette érdeklődésünket, mivel a Xiphophorus halak különösen és a teleosták általában a viselkedési komplexitás olyan kimondottan magas szintjét mutatják35 , amelyet a “hidegvérű” gerincesek más csoportjai, például a kétéltűek és a hüllők nem érnek el. A lepényhal genomját és hat másik szekvenált teleosztból származó génannotációkat felhasználva azt a kérdést tettük fel, hogy a TGD eseményből származó duplikált génmegmaradás szubfunkcionalizáció (az ősi alfunkciók differenciált megtartása) és/vagy neofunkcionalizáció (új alfunkciók megszerzése)36 révén létrehozhatja-e a komplexebb viselkedésmódok elsajátítását. Összehasonlítottunk 190, a megismeréssel kapcsolatos gént (7. kiegészítő táblázat és kiegészítő megjegyzés) a pigmentációban (133 gén, amelynek megnövekedett génrepertoárját összefüggésbe hozták a teleoszta színeződés magas komplexitásával és változatosságával) és a májfunkciókban (187 gén)18 részt vevő génekkel, mint kontrollokkal. A kognícióval kapcsolatos gének elemzése magas, 45%-os duplikátum-megmaradási arányt mutatott a lemezeshalaknál és hasonló értékeket más teleosztoknál (5. ábra és 6. kiegészítő ábra), szemben a pigmentációval (30%) és a májfunkciókkal (15%) kapcsolatos géneknél tapasztalt arányokkal. A teleoszt genomokban az összes génre vonatkozó átlagos duplikált megtartási arányt 12-24%-ra becsülik (37. hivatkozás). Mindhárom funkcionális kategóriából (megismerés, pigmentáció és májfunkció) a TGD után megtartott géneknél nem találtunk torzítást a dózisérzékenység vagy a fehérjekomplexhez tartozás miatt (8. és 9. kiegészítő táblázat és kiegészítő megjegyzés), de a megismerési géneknél (de a májfunkció és pigmentáció géneknél nem) a különösen nagy fehérjék (>1 000 aminosav hosszúságú) géneknél torzítást találtunk (7. kiegészítő ábra, 10. kiegészítő táblázat és kiegészítő megjegyzés). A génveszteségek ábrázolása a filogenetikai fán azt mutatta, hogy a kognitív gének megtartása már röviddel a TGD után és a teleoszt diverzifikáció előtt rögzült. Ez az eredmény alátámasztja azt a hipotézist, hogy a TGD eseményből származó paralógok megtartása támogathatta a Xiphophorus és más teleosztok viselkedési komplexitásának magas szintjét.

5. ábra: A génduplikátumok differenciált megtartása a kogníció, a pigmentáció és a máj funkcionális osztályaiban a teleosztokban a TGD után.
figure5

(a) A kognícióval, pigmentációval és májfunkcióval kapcsolatos gének TGD-eredetű duplikátumainak megtartási aránya hét teleoszt genomban. A Xiphophorushoz vezető vonalat érintő, a teleoszt evolúció során eltelt időszakok vonalakkal vannak összekötve. (b) A génveszteségek filogenetikai feltérképezése a megismeréssel kapcsolatos génduplikátumok 190 párjára a TGD után. A veszteségeket negatív értékek jelzik. A megtartott TGD paralóg párok száma minden egyes teleoszt genom esetében zárójelben szerepel. A TGD paralógiai veszteségeket a Setiamarga et al.39 által megadott teleost filogeniára képeztük le a parszimónia elvét követve. A TGD eseményt 350 millió évvel ezelőttre tettük. A TGD paralógok megtartási arányát az adott vonalban jelen lévő TGD-eredetű duplikátumpárok száma osztva a TGD-eredetű duplikátumpárok számával, amelyek a TGD18 idején jelen voltak.

A platyhal genomszekvenciája és elemzése új perspektívát nyújtott e halmodell számos kiemelkedő jellemzőjével kapcsolatban, beleértve az élve szaporodási módot, a pigmentációs mintázat variációját, a nemi kromoszóma evolúcióját működés közben, a komplex viselkedést és mind a spontán, mind az indukált karcinogenezist17. A teleoszták uralják a ma élő halfaunát, és a teleosztákon belül (1b. ábra) a Poeciliidae család, beleértve a lemezeshalakat, kardfarkúakat, guppikat és molyokat, az adaptációk e széles spektrumának paradigmája. A poeciliida halak ezen első genomjának tanulmányozása rávilágít néhány teleost evolúciós alkalmazkodásra, és fontos forrást biztosít a melanoma és más szegregáló fenotípusok tanulmányozásának előmozdításához.