Articles

Genom ploskolebce Xiphophorus maculatus poskytuje vhled do evoluční adaptace a několika komplexních znaků

Osekvenovali jsme celý genom jedné samice ploskolebce (XX, 2n = 46 chromozomů, kmen Jp163A; obr. 1) ze 104. generace kontinuálního páření bratra a sestry. Celkové pokrytí sekvencí 19,6krát (doplňková poznámka) dalo vzniknout sestavě s kontigem N50 a superkontigem o délce 22 kb a 1,1 Mb (doplňková tabulka 1). Chyby sestavení, většinou jednonukleotidové inserce nebo delece, byly opraveny pomocí čtení Illumina s párovým koncem. Celkem 669 Mb z odhadované délky genomu 750-950 Mb bylo sestaveno do kontigů. Předpovědi genů identifikovaly 20 366 kódujících genů, 348 nekódujících genů a 28 pseudogenů (Doplňková poznámka).

Obrázek 1: Ploštice X. maculatus.
figure1

(a) Samice (nahoře) a samci (dole) platyfish, kmene Jp163A s černými pigmentovými skvrnami na hřbetní ploutvi, které vznikají při vhodném řízení aktivity chromozomálního onkogenu X. U hybridních genotypů je tato kontrola narušena a ze skvrn se vyvíjí maligní melanom. (b) Fylogenetická pozice platýse vzhledem k ostatním druhům ryb

Stejně jako u ostatních teleostů byly transponovatelné elementy (TE) u platýse velmi rozmanité, včetně mnoha čeledí, které chybí u savců1 a ptáků (doplňkové obr. 1-3, doplňkové tabulky 2 a 3 a doplňková poznámka). Zjistili jsme, že 4,8 % transkriptomu pochází ze sekvencí TE reprezentujících přibližně 40 různých rodin, což naznačuje, že mnohé z TE platyfish jsou s největší pravděpodobností stále aktivní. Nejaktivnějšími TE byly DNA transpozony Tc1 (>16 000 kopií), následované rodinou RTE (>9 000 kopií). Pozoruhodné je, že jsme identifikovali několik téměř neporušených obálkových kopií pěnového retroviru (Spumaviridae) integrovaných do genomu platýse (obr. 2). Pěnovité viry jsou známy jako exogenní infekční agens u savců2. Teprve nedávno byly popsány endogenní sekvence pěnových virů, které mohou představovat fosilní záznam infekcí, v genomech lenochoda3 a aye-aye4 u savců a u coelacanta5. Sekvence podobná pěnovitému viru u zebřičky6 , sekvence u tresky objevená během této práce a zde uváděná sekvence genomu platýse ukazují ještě širší spektrum hostitelů. Molekulární fylogeneze pěnových virů je v souladu s fylogenezí hostitelů (obr. 2). Tento výsledek podporuje představu o dávném mořském evolučním původu tohoto typu viru s možnou koevolucí hostitele a viru5. Téměř neporušené kopie pěnového viru nalezené v genomech některých divergentních druhů ryb, které chybí v genomech jiných sekvenovaných ryb, mohou naznačovat nezávislé zavedení zárodečné linie prostřednictvím infekce. Exogenní pěnový virus nebyl u ryb popsán; naše výsledky však naznačují, že exogenní pěnový virus byl a možná stále je infekční v rybí linii.

Obrázek 2: Fylogenetický strom endogenních retrovirů založený na sekvencích proteinů reverzní transkriptázy.
figure2

Sekvence fosilních virů (FV) (světle modré stínování) tvoří dvě odlišné fylogenetické skupiny, jednu specifickou pro tetrapody a druhou pro teleosty. Obě skupiny obsahují endogenní sekvence pěnového viru (EFV) (nově identifikované sekvence platýsů a tresek jsou zvýrazněny tmavomodrým stínováním). Zarovnání bylo provedeno pomocí programu ClustalW (223 aminokyselin) a fylogenetický strom byl sestaven pomocí balíčku PhyML s použitím metod maximální věrohodnosti38 s výchozím bootstrapem (zobrazeným na začátku větví) a optimalizovanými možnostmi výpočtu. FV, pěnový virus; MuERV-L, Mus musculus endogenous retrovirus-L; BAEV, baboon endogenous virus; FENV1, feline endogenous virus 1; EFV, endogenous foamy virus, MLV, murine leukemia virus; HERV-K, human endogenous retrovirus-K; MMTV, mouse mammary tumor virus; HIV-1, human immunodeficiency virus-1. Stupnice představuje počet substitucí na jedno místo.

Homologické mapy savčích chromozomů ukazují mozaikovité uspořádání v průměru asi 35 velkých konzervovaných bloků syntézy (ale asi 80 u psa a 200 u myši) a četné malé bloky sestavené v různých kombinacích mezi různými druhy a zahrnující více než 90 milionů let evoluce7. Sestavili jsme nejrozsáhlejší dosud publikovanou meiotickou genetickou mapu pro všechny obratlovce, která umožnila uspořádání lešení X. maculatus a přesnou analýzu konzervované syntézy při porovnávání genomů ryb (doplňková poznámka). Ke konstrukci meiotické mapy sestávající z 16 245 polymorfních markerů, které definují 24 vazebných skupin odpovídajících počtu haploidních chromozomů platýse, jsme použili inovativní přístup založený na DNA asociované s restrikčními místy (RAD)8 . Tak bylo možné přiřadit 90,17 % všech sekvencí v kontigenech chromozomální pozici. Dlouhodobé porovnávání pořadí genů napříč druhy10 identifikovalo nové evoluční vztahy mezi chromozomy platýsů a jiných teleostů. Medaka, nejbližší příbuzný se sekvenovaným genomem, má také 24 chromozomů a 19 z nich vykazovalo přísný vztah jedna ku jedné s chromozomy platýse (obr. 3a,b). Zbývajících pět chromozomů platýse bylo rovněž každý ortologický s jedním chromozomem medaky, s výjimkou jednoho nebo dvou krátkých segmentů (o délce ∼1 Mb), které se nacházely na jiném chromozomu medaky (obr. 3c a doplňkový obr. 4). Od divergence medaky a platýse před 120 miliony let tedy narušilo karyotypy poměrně málo translokací, všechny velmi krátké11,12 . Podobný obrázek vyplynul ze srovnání chromozomů platyfish s chromozomy stickleback (divergence před 180 miliony let)11,12. Tato zjištění podrobně ukazují dosud neznámý široký rozsah, v jakém se genetický obsah chromozomů těchto teleostů zachoval během téměř 200 milionů let evoluce, což je mnohem více než u savců za přibližně polovinu této doby7,11,12. To je vzhledem k duplikaci genomu teleostů (TGD) poněkud neočekávané, protože by se dalo předpokládat, že nelegitimní párování paralogních chromozomů (vzniklé v důsledku TGD) mohlo usnadnit translokace. Mechanismy, které mohly takové translokace zmírnit, zůstávají neznámé.

Obrázek 3: Zachované syntézy mezi platyfish a medaka.
figure3

(a) Ortologové genů na X u medaky. maculatus chromozomu 9 (Xma9) mají tendenci ležet na chromozomu Oryzias latipes 4 (Ola4), což ukazuje, že genový obsah těchto chromozomů zůstal nedotčen bez translokací za 120 milionů let od rozdělení linií těchto druhů. Každá šedá tečka podél vodorovné osy označené Xma9 představuje pozici genu platyfish, jehož ortolog z medaky (podle reciproké best-BLAST analýzy shody) leží přímo vertikálně ke genu Xma9, vynesenému na příslušném chromozomu medaky10. (b) Recipročně téměř všechny ortology genů platyfish na chromozomu medaka Ola4 leží na Xma9. (c) Téměř všechny ortology genu Xma19 na chromozomu medaka leží na chromozomu Ola22, s výjimkou úseku dlouhého asi 1 Mb na pozici 20 Mb na chromozomu Ola22, který se objevuje na chromozomu Ola24 (čárkovaný rámeček).

Medaka je dobře známým modelem ve výzkumu rakoviny13. Její genom obsahuje nádorovou kontrolní oblast (TCR) včetně onkogenu xmrk14 , který spouští vznik melanomu. TCR obsahuje také nádorový modifikátor mdl15,16. Alelické varianty mdl řídí tělní kompartment, dobu vzniku a závažnost nádorů17. Kromě toho se alely mdl projevují u ploštic jako vysoká rozmanitost geneticky definovaných pigmentových vzorů. Zmapovaný genom nám umožnil vyloučit mnoho pigmentových genů jako odpovědných faktorů za tyto pohlavně vázané pigmentové varianty a modifikátory melanomu. Všechny známé pigmentové geny18 byly přítomny v genomu XX samic platyfish; žádný z nich tedy není specifický pro chromozom Y. Pouze 6 ze 174 známých pigmentových genů (asip2a, egfrb, muted, myca, rps20 a tfap2a) se nacházelo na chromozomu X (Xma21). Z těchto šesti se pouze protoonkogen egfrb nacházel dostatečně blízko melanomového onkogenu xmrk (doplňková tabulka 4), aby mohl být považován za kandidátský gen pro mdl. Biochemické studie totiž ukázaly, že egfrb může spolupracovat s xmrk19 , ale hladiny exprese těchto genů jsou u melanomu inverzně regulovány20. K vyhodnocení funkce egfrb a nalezení dalších kandidátů na neklasické pigmentační geny v této genomové oblasti, které mohou řídit jak pigmentový vzor, tak fenotyp melanomu, jsou zapotřebí další studie.

Další dosud neidentifikovanou genetickou složkou modelu melanomu Xiphophorus je gen R/Diff. R/Diff potlačuje tvorbu melanomu u volně žijících ploskolebců a eliminace jeho exprese mezidruhovou hybridizací umožňuje růst nádoru. Gen R/Diff byl mapován do intervalu 10 cm na Xma5 v blízkosti lokusu cdkn2a/b21. Přestože ortologický lidský gen CDKN2A je dobře popsaným nádorovým supresorovým genem u některých lidských melanomů22 , cdkn2a/b byl vyloučen z R/Diff, protože není mutován, ale naopak je nadměrně exprimován v modelu melanomu Xiphophorus23. Sekvence Xma5 nyní definuje řadu kandidátních genů R/Diff pro další zkoumání. Například scaffold 182 (1 085 500 bp), který ukrývá cdkn2a/b, obsahuje několik genů s vysokým potenciálem hrát roli R/Diff nádorového supresoru (například tet2, cxxc4, mtap, topo-rs, mdx4 a pdcd4a). Alternativně může tato oblast představovat komplexní lokus zahrnující několik genů, které působí synergicky nebo kompenzačně při regulaci onkogenu xmrk, což je v souladu s předchozími zprávami o spontánní a indukované karcinogenezi u mnoha modelů mezidruhových hybridních nádorů Xiphophorus24,25,26 .

Viviparita je propracovaný způsob rozmnožování zahrnující různé úrovně mateřských investic do potomstva, od plného zásobení vajíček před oplozením a jejich udržení během vývoje až po minimální zásobení vajíček před oplozením a jejich zásobení po oplození prostřednictvím placenty, jako je tomu u savců. Čeleď rybovitých (Poeciliidae), monofyletický klan s více než 260 druhy27 , je neobvyklá tím, že zahrnuje druhy, které zahrnují spektrum od zanedbatelného až po rozsáhlé zaopatření po oplození28,29 . Genom platyfish je prvním genomem neptačího živorodého obratlovce. U platyfish a také u druhé živorodé ryby, mečovky Xiphophorus hellerii, které mají obě dobře zaopatřené jikry před oplozením30,31, jsme provedli analýzu 3 skupin viviparních genů (geny pro žloutek, placentu a vaječný obal; n = 34) na ztrátu genů a pozitivní selekci ve srovnání se 4 druhy teleostů kladoucích jikry (medaka, tetraodon, stickleback a zebřička).

U savců byl navržen vznik viviparity zahrnující postupnou ztrátu vitellogeninů (prekurzorů žloutku)32 . U platýse a mečouna byly všechny geny související se žloutkem (vitellogeniny a jejich transportéry/receptory; doplňková tabulka 5) přítomny a vyvíjely se pod purifikační selekcí, což odpovídá tomu, že oba druhy plně zásobují vajíčka před oplozením, s výjimkou jednoho genu, který se vyvíjel pod pozitivní selekcí, vitellogeninu1 (doplňkový obr. 5). 5a).

Tři ze 13 genů platýse, jejichž ortologové u savců souvisejí s vývojem placenty, se vyvíjely pod pozitivní selekcí (obr. 4a, doplňkový obr. 5b-d a doplňková tab. 5). Igf2, který u myši reguluje propustnost placenty33 , se u platýse vyvinul pod silnou pozitivní selekcí (obr. 4a), která postihla zejména oblast distálně od místa proteolýzy. Sekvence igf233 byla k dispozici také u dalšího poeciliida, pouštního vrkoče Poeciliopsis lucida, který má s druhem Xiphophorus společného živého předka, ale liší se tím, že se u něj placentace vyvinula nedávno. U pouštní mihule se pod pozitivní selekcí vyvinula stejná oblast jako u platýse, ale selekce byla ještě silnější (doplňkový obr. 5b), což naznačuje probíhající molekulární adaptivní evoluci od doby, kdy se oba rody obsahující tyto ryby před několika miliony let rozdělily. Další dva placentární geny, pparg a ncoa6, měly více oblastí se signály pozitivní selekce mimo známé funkční domény, což naznačuje nové oblasti důležité pro viviparitu. Stejné geny pod selekcí u živorodých ryb však nevykazovaly signály pozitivní selekce, když byly analyzovány ortologní geny z ploutvonožců kladoucích vajíčka a z vačnatců a placentálních savců (doplňková tabulka 6). Tento výsledek je v souladu se skutečností, že placenty savců a ryb jsou konvergentní, ale nikoli homologické struktury.

Obr. 4: Posteriorní pravděpodobnosti pro třídy míst podle alternativních modelů podél genu pro každé aminokyselinové místo vypočtené Bayesovou empirickou Bayesovou analýzou.
figure4

Místa třídy 1 jsou pod čistící selekcí (poměr Ka/Ks ∼0), místa třídy 2 jsou pod neutrální selekcí (poměr Ka/Ks ∼1) a místa třídy 3 jsou u druhu Xiphophorus pod pozitivní selekcí. (a) Růstový faktor 2 podobný inzulínu (IGF2). Barevné sloupce pod grafem znázorňují známé funkční domény a šipka ukazuje místo proteolýzy (mezi zbytky 118 a 119). (b) ChoriogeninH minor. Nahoře srovnání snůšky vajíček a živých ryb. Dole srovnání placentálních a neplacentárních savců. Stejné oblasti jsou pod pozitivní selekcí u ryb i savců.

Geny Zona pellucida (Zpc), které vytvářejí na glykoproteiny bohatý plášť obklopující plazmatickou membránu oocytu, vykazovaly nejvýraznější změny. alveolin byl z genomu platýse ztracen. Naopak choriogeninH minor, choriolysinL, choriolysinH a zvep se vyvíjely pod pozitivní selekcí (obr. 4b, doplňkový obr. 5e-g a doplňková tab. 5). U Xenopus laevis kontrolují geny Zpc druhově specifickou vazbu spermií a pomáhají zajistit, aby vajíčka oplodnily pouze konspecifické spermie uvolněné do vodního prostředí34. U živorodých ryb však dochází k vnitřnímu oplození, kde by druhově specifické rozpoznávání spermií nebylo tak zásadní. Oproti rybám kladoucím vajíčka se u těchto ryb očekává, že se skořápka přizpůsobila vývoji uvnitř matky, protože již není nezbytná pro ochranu, ale musí usnadňovat výměnu plynů a materiálu. Geny líhnoucích se enzymů zvep a choriolysinH vykazovaly rychle se vyvíjející místa, která se obecně nacházela v sousedství katalytických domén (doplňkový obr. 4f,g), což naznačuje, že během evoluce živorodosti se u těchto enzymů mohly změnit interakce s cílovými nebo regulačními proteiny. Je pozoruhodné, že u choriogeninuH minor se stejné oblasti, zejména v doméně zona pellucida, vyvinuly pod pozitivní selekcí jak u savců, tak u ryb (obr. 4b). To je nápadný příklad toho, jak se konvergentní evoluce na molekulární úrovni projevuje na fyziologické a nakonec i morfologické úrovni.

Naše analýzy důsledků TGD odhalily funkční třídu genů, která vzbudila náš zájem, protože zejména ryby rodu Xiphophorus a teleosty obecně vykazují výrazně vysokou úroveň komplexity chování35 , které jiné skupiny „studenokrevných“ obratlovců, jako jsou obojživelníci a plazi, nedosahují. Na základě genomu platýse a genových anotací šesti dalších sekvenovaných teleostů jsme si položili otázku, zda zachování duplicitních genů z události TGD může způsobit prostřednictvím subfunkcionalizace (rozdílné zachování subfunkcí předků) a/nebo neofunkcionalizace (získání nových subfunkcí)36 získání komplexnějšího chování. Srovnávali jsme 190 genů souvisejících s poznáváním (doplňková tabulka 7 a doplňková poznámka) s těmi, které se podílejí na pigmentaci (133 genů, u nichž byl zvýšený genový repertoár spojen s vysokou složitostí a rozmanitostí zbarvení teleostů) a jaterních funkcích (187 genů)18 jako kontroly. Analýza genů souvisejících s poznáváním ukázala vysokou míru zachování duplicit 45 % u platýsů a podobné hodnoty u ostatních teleostů (obr. 5 a doplňkový obr. 6) ve srovnání s mírou pozorovanou u genů souvisejících s pigmentací (30 %) a funkcí jater (15 %). Průměrná míra zachování duplikátů u všech genů v genomech teleostů se odhaduje na 12-24 % (cit.37 ). U genů ze všech tří funkčních kategorií (poznávání, pigmentace a funkce jater), které byly zachovány po TGD, jsme nezjistili žádné zkreslení z důvodu citlivosti na dávkování nebo příslušnosti k proteinovým komplexům (doplňkové tabulky 8 a 9 a doplňková poznámka), ale bylo zjištěno zkreslení u genů pro poznávání (ale ne u genů pro funkci jater a pigmentaci) pro zvláště velké proteiny (délka >1 000 aminokyselin) (doplňkový obr. 7, doplňková tabulka 10 a doplňková poznámka). Zakreslení úbytku genů do fylogenetického stromu ukázalo, že retence kognitivních genů byla stanovena již krátce po TGD a před diverzifikací teleostů. Toto zjištění podporuje hypotézu, že retence paralogů z události TGD mohla podpořit vysokou úroveň komplexity chování u Xiphophorus a dalších teleostů.

Obr. 5: Rozdílná retence genových duplikátů v kognici, pigmentaci a funkčních třídách jater u teleostů po TGD.
figure5

(a) Míra zachování duplikátů genů souvisejících s poznáváním, pigmentací a funkcí jater po TGD u sedmi genomů teleostů. Časové body během evoluce teleostů, které zahrnují linii vedoucí k Xiphophorus, jsou spojeny čarami. (b) Fylogenetické mapování ztrát genů pro 190 párů duplikátů genů souvisejících s poznáváním po TGD. Ztráty jsou označeny zápornými hodnotami. Počet zachovaných párů paralogů po TGD pro každý jednotlivý genom teleostů je uveden v závorce. Ztráty paralogů TGD byly mapovány na fylogenezi teleostů, kterou poskytl Setiamarga et al.39 , podle principu parsimonie. Událost TGD byla stanovena na dobu před 350 miliony let. Míra zachování paralogů TGD je definována počtem párů duplikátů odvozených od TGD přítomných v konkrétní linii děleným počtem párů duplikátů odvozených od TGD přítomných v době TGD18.

Sekvence a analýza genomu platýse poskytly nové pohledy na několik významných rysů tohoto modelu ryby, včetně způsobu rozmnožování za živa, variability vzorů pigmentace, evoluce pohlavních chromozomů v akci, komplexního chování a spontánní i indukované karcinogeneze17. Teleosty dominují současné rybí fauně a v rámci teleostů (obr. 1b) je čeleď Poeciliidae, zahrnující platýse, mečovky, gupky a mloky, paradigmatem tohoto širokého spektra adaptací. Naše studie tohoto prvního genomu poeciliidních ryb osvětluje některé evoluční adaptace teleostů a poskytuje důležitý zdroj informací pro další studium melanomu a dalších segregačních fenotypů.

.