Articles

Het genoom van de platyvis, Xiphophorus maculatus, verschaft inzicht in evolutionaire adaptatie en verscheidene complexe eigenschappen

We hebben het volledige genoom van één platyvis vrouwtje (XX, 2n = 46 chromosomen, Jp163A stam; Fig. 1) gesequeneerd van generatie 104 van continue broer-zus paringen. Totale sequentie dekking van 19,6-voud (Supplementary Note) produceerde een montage met N50 contig en supercontig lengtes van 22 kb en 1,1 Mb, respectievelijk (Supplementary Table 1). Vergadering fouten, meestal single-nucleotide invoegingen of verwijderingen, werden gecorrigeerd met Illumina gepaarde-end leest. Een totaal van 669 Mb van de geschatte genoomlengte van 750-950 Mb werd geassembleerd in contigs. Genvoorspellingen identificeerden 20.366 coderende genen, 348 niet-coderende genen en 28 pseudogenen (Supplementary Note).

Figuur 1: De platyvis, X. maculatus.
figure1

(a) Vrouwelijke (boven) en mannelijke (onder) platyvissen, van stam Jp163A met zwarte pigmentvlekken op de rugvin die ontstaan wanneer de activiteit van een X-chromosomaal oncogen op de juiste wijze wordt gecontroleerd. Bij hybride genotypen is deze controle aangetast, en ontwikkelt zich uit de vlekken een kwaadaardig melanoom. (b) Fylogenetische positie van de platyvis ten opzichte van andere vissoorten.

Zoals in andere teleosts, waren de transponeerbare elementen (TEs) in de platyvis zeer divers, met inbegrip van vele families die afwezig zijn in zoogdieren1 en vogels (Supplementary Figs. 1-3, Supplementary Tables 2 en 3 en Supplementary Note). We vonden dat 4.8% van het transcriptoom afkomstig was van TE-sequenties die ongeveer 40 verschillende families vertegenwoordigden, wat aangeeft dat veel van de platyfish TEs hoogstwaarschijnlijk nog steeds actief zijn. De meest actieve TEs waren Tc1 DNA transposons (>16.000 kopieën), gevolgd door de RTE familie (>9.000 kopieën). In het bijzonder identificeerden we verschillende bijna-intacte envelope-coderende kopieën van een schuimachtig retrovirus (Spumaviridae) geïntegreerd in het platyfishgenoom (Fig. 2). Schuimachtige virussen zijn bekend als exogene infectieuze agentia bij zoogdieren2. Pas onlangs zijn endogene schuimvirus-sequenties die kunnen worden gebruikt om een fossiel verslag van infecties weer te geven, beschreven in de genomen van de luiaard3 en de roeiboot4 bij zoogdieren en in de coelacanth5. Een op een schuimvirus lijkende sequentie in de zebravis6, een sequentie in kabeljauw die tijdens dit werk werd ontdekt en de hier gerapporteerde sequentie in het genoom van de platyvis laten een nog breder spectrum van gastheren zien. De moleculaire fylogenie van schuimvirussen is consistent met de fylogenie van de gastheren (Fig. 2). Dit resultaat ondersteunt de notie van een oude mariene evolutionaire oorsprong van dit type virus, met mogelijke gastheer-virus coevolutie5. De bijna intacte kopieën van het schuimvirus die gevonden werden in de genomen van enkele divergerende vissoorten, afwezig in andere gesequenteerde visgenomen, zouden kunnen wijzen op onafhankelijke kiembaanintroducties door infectie. Exogeen schuimvirus was nog niet beschreven bij vissen; onze resultaten suggereren echter dat exogene schuimvirussen infectieus zijn geweest en mogelijk nog steeds zijn in de vislijn.

Figuur 2: Fylogenetische boom van endogene retrovirussen gebaseerd op reverse transcriptase proteïne sequenties.
figure2

Reeksen van schuimvirussen (FV) (lichtblauwe arcering) vormen twee verschillende fylogenetische groepen, één specifiek voor Tetrapoda en één specifiek voor Teleost. Beide groepen bevatten endogene sequenties van het schuimvirus (EFV) (de pas geïdentificeerde platyfish- en kabeljauwsequenties zijn met donkerblauwe arcering gemarkeerd). De alignering werd uitgevoerd met ClustalW (223 aminozuren), en de fylogenetische boom werd geconstrueerd met het PhyML-pakket met behulp van maximum-likelihoodmethoden38 met standaard bootstrap (weergegeven aan het begin van de takken) en geoptimaliseerde berekeningsopties. FV, schuimvirus; MuERV-L, musculus endogeen retrovirus-L; BAEV, baviaan endogeen virus; FENV1, katachtig endogeen virus 1; EFV, endogeen schuimvirus, MLV, muizenleukemievirus; HERV-K, humaan endogeen retrovirus-K; MMTV, muizenmammacarcinoomvirus; HIV-1, humaan immunodeficiëntievirus-1. De schaalbalk geeft het aantal substituties per site weer.

Chromosoomhomologiekaarten van zoogdieren vertonen een lappendeken van gemiddeld ongeveer 35 grote geconserveerde syntenieblokken (maar ongeveer 80 bij de hond en 200 bij de muis) en talrijke kleine blokken die in verschillende combinaties bij de verschillende soorten zijn gegroepeerd en meer dan 90 miljoen jaar evolutie bestrijken7. We construeerden de meest uitgebreide meiotische genetische kaart voor een gewerveld dier tot nu toe gepubliceerd, die het mogelijk maakte de rangschikking van X. maculatus scaffolds en nauwkeurige geconserveerde syntenie analyse het vergelijken van vis genomen (Supplementary Note). We gebruikten de innovatieve restrictie site-geassocieerd DNA (RAD)-tag aanpak8 om een meiotische kaart bestaande uit 16.245 polymorfe markers die 24 linkage groepen gelijkwaardig aan het haploïde chromosoom aantal van de platyfish9 definiëren construeren. Zo kon aan 90,17% van de totale sequenties in contigs een chromosomale positie worden toegekend. Lange afstand vergelijkingen van de volgorde van de genen in soorten 10 geïdentificeerd nieuwe evolutionaire relaties tussen platyfish en andere teleost chromosomen. Medaka, de dichtstbijzijnde familielid met een gesequenced genoom, heeft ook 24 chromosomen, en 19 van deze toonden een strikte een-op-een relatie met de platyfish chromosomen (Fig. 3a,b). De overige vijf platyfish chromosomen waren ook elk ortholoog aan een enkele medaka chromosoom, met uitzondering van een of twee korte segmenten (∼1 Mb in lengte) die waren gelegen op een andere medaka chromosoom (Fig. 3c en aanvullende Fig. 4). Aldus hebben een behoorlijk aantal translocaties, alle zeer kort, het karyotype verstoord sinds de divergentie van medaka en platyfish 120 miljoen jaar geleden11,12. Een soortgelijk beeld kwam naar voren uit vergelijkingen van de chromosomen van platyvissen met die van stekelbaarzen (divergentie 180 miljoen jaar geleden)11,12. Deze bevindingen laten zien dat de genetische inhoud van de chromosomen bij deze teleosts gedurende bijna 200 miljoen jaar evolutie in grote lijnen bewaard is gebleven, een veel grotere mate van behoud dan bij zoogdieren gedurende ongeveer de helft van die tijd7,11,12. Dit is enigszins onverwacht, gezien de verdubbeling van het teleostgenoom (TGD), omdat men had kunnen denken dat de onwettige koppeling van paraloge chromosomen (als gevolg van TGD) translocaties zou hebben vergemakkelijkt. De mechanismen die dergelijke translocaties kunnen hebben beperkt, zijn nog onbekend.

Figuur 3: Overeengekomen syntenieën tussen platyfish en medaka.
figure3

(a) De medaka-orthologs van genen op X. maculatus-chromosoom 9 (Xma9) liggen meestal op chromosoom 4 (Ola4) van Oryzias latipes, waaruit blijkt dat de geninhoud van deze chromosomen intact is gebleven zonder translocaties in de 120 miljoen jaar sinds de lineages van deze soorten divergeerden. Elke grijze stip langs de horizontale as met het label Xma9 vertegenwoordigt de positie van een platyfish gen waarvan de medaka ortholoog (zoals beoordeeld door wederzijdse best-BLAST hit-analyse) ligt direct verticaal ten opzichte van de Xma9 gen, uitgezet op de juiste medaka chromosoom10. (b) Omgekeerd liggen bijna alle platyfish-orthologs van genen op medaka-chromosoom Ola4 op Xma9. (c) Bijna alle medaka-orthologs van Xma19 liggen op Ola22, behalve een segment van ongeveer 1 Mb lang op positie 20 Mb op Ola22 dat op Ola24 ligt (gestippeld vak).

De platyfish is een bekend model in kankeronderzoek13. Zijn genoom bevat een tumorcontrolegebied (TCR), met inbegrip van het oncogen xmrk14 dat de ontwikkeling van melanomen in gang zet. Het TCR bevat ook de tumormodificator mdl15,16. Mdl allelvarianten controleren het lichaamscompartiment, het tijdstip van ontstaan en de ernst van tumoren17. Bovendien manifesteren mdl-allelen zich bij platyvissen als een grote diversiteit aan genetisch bepaalde pigmentpatronen. Met het in kaart gebrachte genoom konden we veel pigmentgenen uitsluiten als de verantwoordelijke factoren voor deze geslachtsgebonden pigmentvarianten en melanoma modifiers. Alle bekende pigmentgenen18 waren aanwezig in het XX vrouwelijke platyvisgenoom; geen ervan is dus Y-chromosomenspecifiek. Slechts 6 van de 174 bekende pigmentgenen (asip2a, egfrb, muted, myca, rps20 en tfap2a) bevonden zich op het X-chromosoom (Xma21). Van deze zes genen lag alleen het proto-oncogen egfrb dicht genoeg bij het melanoom-oncogen xmrk (aanvullende tabel 4) om als een kandidaat-gen voor mdl te worden beschouwd. Inderdaad hebben biochemische studies aangetoond dat Egfrb kan samenwerken met Xmrk19, maar de expressieniveaus van deze genen zijn omgekeerd gereguleerd in melanoom20. Verdere studies zijn nodig om de functie van Egfrb te evalueren en andere niet-klassieke pigmentatie gen-kandidaten in deze genomische regio te vinden die zowel het pigmentpatroon als het melanoom fenotype kunnen controleren.

Een andere tot dusver onbekende genetische component van het Xiphophorus melanoom model is het R/Diff gen. R/Diff onderdrukt de vorming van melanomen in wilde platyvissen, en de eliminatie van de expressie ervan door interspecies hybridisatie maakt tumorgroei mogelijk. R/Diff werd in kaart gebracht op een 10-cM interval op Xma5 in de buurt van de cdkn2a/b locus21. Hoewel het orthologe humane CDKN2A gen een goed beschreven tumor suppressor gen is in bepaalde humane melanoma’s22, werd cdkn2a/b uitgesloten van R/Diff omdat het niet gemuteerd is maar in plaats daarvan overexpressief is in het Xiphophorus melanoma model23. De Xma5-sequentie definieert nu een aantal R/Diff-kandidaatgenen voor verder onderzoek. Zo bevat scaffold 182 (1.085.500 bp), waarin cdkn2a/b ligt, diverse genen met een hoog potentieel voor een rol als R/Diff tumoronderdrukker (bijvoorbeeld tet2, cxxc4, mtap, topo-rs, mdx4 en pdcd4a). Een andere mogelijkheid is dat de regio een complexe locus vertegenwoordigt die verschillende genen omvat die op een synergetische of compenserende manier werken om het xmrk oncogen te reguleren, in overeenstemming met eerdere meldingen van spontane en geïnduceerde carcinogenese in de vele Xiphophorus interspecies hybride tumormodellen24,25,26.

Vivipariteit is een uitgebreide voortplantingswijze met verschillende niveaus van maternale investering in de nakomelingen, variërend van het volledig bevoorraden van de eieren vóór de bevruchting en het behoud ervan gedurende de ontwikkeling tot het minimaal bevoorraden van de eieren vóór de bevruchting en het bevoorraden ervan na de bevruchting via een placenta, zoals bij zoogdieren. De visfamilie Poeciliidae, een monofyletische clade van meer dan 260 soorten27, is ongewoon in het omvatten van soorten die het spectrum van verwaarloosbare tot uitgebreide bevoorrading na de bevruchting28,29 overspannen. Het genoom van de platyvis is het eerste van een gewerveld dier dat geen zoogdier is, maar wel levendbarend. We analyseerden in de platyfish en in een tweede levendbarende vis, de zwaarddragers Xiphophorus hellerii, die beide goed bevoorraadde eieren hebben vóór de bevruchting30,31, 3 groepen van vivipariteitgenen (dooier-, placenta- en eivliesgenen; n = 34) op genverlies en positieve selectie in vergelijking met 4 soorten eierleggende teleosts (medaka, tetraodon, stekelbaars en zebravis).

Bij zoogdieren is voorgesteld dat het ontstaan van levendbarheid gepaard gaat met een progressief verlies van vitellogenines (voorlopers van de dooier)32. In platyfish en swordtail waren alle dooier-gerelateerde genen (vitellogenines en hun transporters/receptoren; supplementaire tabel 5) aanwezig en geëvolueerd onder zuiverende selectie, consistent met het feit dat beide soorten de eieren volledig bevoorraden vóór de bevruchting, met uitzondering van één gen dat evolueerde onder positieve selectie, vitellogenine1 (supplementaire fig. 5a).

Drie van de 13 platyfish genen, waarvan de zoogdier-orthologs gerelateerd zijn aan placenta ontwikkeling, evolueerden onder positieve selectie (Fig. 4a, Supplementary Fig. 5b-d en Supplementary Table 5). Igf2, dat in de muis de placenta permeabiliteit33 regelt, evolueerde onder sterke positieve selectie in platyfish (Fig. 4a), die vooral de regio distaal van de proteolyse plaats beïnvloedde. De igf2-sequentie33 was ook beschikbaar van een andere poeciliide, de woestijnbovenminnow Poeciliopsis lucida, die een levendbarende voorouder deelt met Xiphophorus-soorten, maar verschilt in het feit dat placentatie recentelijk is geëvolueerd. In de woestijn topminnow evolueerde dezelfde regio als in platyfish onder positieve selectie, maar de selectie was nog sterker (Supplementary Fig. 5b), wat suggereert dat moleculaire adaptieve evolutie aan de gang is sinds de twee genera die deze vissen bevatten enkele miljoenen jaren geleden divergeerden. De twee andere placentale genen, pparg en ncoa6, hadden meerdere regio’s met signalen voor positieve selectie buiten bekende functionele domeinen, wat wijst op nieuwe regio’s die belangrijk zijn voor vivipariteit. Dezelfde genen onder selectie in levendbarende vissen vertoonden echter geen positieve selectiesignaturen wanneer orthologe genen van het eierleggend vogelbekdier en van buideldieren en placentale zoogdieren werden geanalyseerd (supplementaire tabel 6). Dit resultaat is in overeenstemming met het feit dat de placenta’s van zoogdieren en vissen convergerende maar geen homologe structuren zijn.

Figuur 4: Posterieure waarschijnlijkheden voor site-klassen onder alternatieve modellen langs het gen voor elke amino-zuur site berekend door Bayes empirische Bayes-analyse.
figure4

Klasse 1-sites staan onder zuiverende selectie (Ka/Ks-verhouding van ∼0), klasse 2-sites staan onder neutrale selectie (Ka/Ks-verhouding van ∼1), en klasse 3-sites staan onder positieve selectie bij Xiphophorus-soorten. (a) Insuline-achtige groeifactor 2 (IGF2). Gekleurde balken onder de plot tonen bekende functionele domeinen, en de pijl toont de proteolyse site (tussen residu’s 118 en 119). (b) ChoriogenineH minor. Boven, vergelijking van ei-leggende versus levendbarende vissen. Onder, vergelijking van placentale versus niet-placentale zoogdieren. Dezelfde regio’s staan onder positieve selectie bij vissen en zoogdieren.

Zona pellucida (Zpc)-genen, die een glycoproteïnerijke laag produceren die de plasmamembraan van de eicel omgeeft, vertoonden de meest uitgesproken veranderingen. alveoline ging uit het platyfish-genoom verloren. Daarentegen evolueerden choriogenineH minor, choriolysineL, choriolysineH en zvep onder positieve selectie (Fig. 4b, supplementaire Fig. 5e-g en supplementaire Tabel 5). Bij Xenopus laevis controleren de zpc-genen de soortspecifieke binding van sperma en helpen zij ervoor te zorgen dat alleen soortgelijk sperma dat in de waterige omgeving vrijkomt, de eitjes bevrucht34. Levendbarende vissen, echter, hebben interne bevruchting, waar soort-specifieke sperma erkenning zou niet zo cruciaal. In vergelijking met eierleggende vissen zal de eierschaal bij deze vissen zich waarschijnlijk hebben aangepast aan de ontwikkeling in de moeder, aangezien deze niet langer essentieel is voor de bescherming, maar wel de uitwisseling van gassen en materiaal moet vergemakkelijken. De genen voor broed-enzymen zvep en choriolysinH vertoonden snel evoluerende sites die zich over het algemeen naast de katalytische domeinen bevonden (supplementaire Fig. 4f,g), wat erop wijst dat deze enzymen tijdens de evolutie van vivipariteit gewijzigde interacties met doel- of regulerende eiwitten zouden kunnen hebben. Opmerkelijk is dat in choriogenineH minor dezelfde regio’s, in het bijzonder in het zona pellucida domein, evolueerden onder positieve selectie in zowel zoogdieren als vissen (Fig. 4b). Dit is een opmerkelijk voorbeeld van hoe convergente evolutie op moleculair niveau zich manifesteert op fysiologisch en uiteindelijk morfologisch niveau.

Onze analyses van de gevolgen van TGD brachten een functionele klasse van genen aan het licht die onze interesse wekten omdat Xiphophorus vissen in het bijzonder en teleosts in het algemeen een uitgesproken hoog niveau van gedragscomplexiteit35 vertonen die andere groepen van ‘koudbloedige’ gewervelde dieren zoals amfibieën en reptielen niet bereiken. Gebruikmakend van het platyfish genoom en genannotaties van zes andere gesequenteerde teleosts, vroegen we ons af of dubbele genretentie van de TGD gebeurtenis door subfunctionalisatie (differentieel behoud van voorouderlijke subfuncties) en/of neofunctionalisatie (verwerving van nieuwe subfuncties)36 de verwerving van complexere gedragingen zou kunnen veroorzaken. We vergeleken 190 cognitie-gerelateerde genen (supplementaire tabel 7 en aanvullende noot) met die betrokken bij pigmentatie (133 genen, waarvoor een verhoogd genrepertoire in verband is gebracht met de grote complexiteit en diversiteit van de teleostkleuring) en leverfuncties (187 genen)18 als controles. Analyse van cognitie-gerelateerde genen toonde een hoge dubbele retentie van 45% in platyfish en vergelijkbare waarden in andere teleosts (Fig. 5 en supplementaire Fig. 6) vergeleken met de percentages gezien voor genen gerelateerd aan pigmentatie (30%) en leverfunctie (15%). De gemiddelde dubbele retentie over alle genen in de genomen van teleosts wordt geschat op 12-24% (ref. 37). We vonden geen bias in genen uit alle drie de functionele categorieën (cognitie, pigmentatie en leverfunctie) die werden behouden na TGD als gevolg van doseringsgevoeligheid of lidmaatschap van eiwitcomplexen (aanvullende tabellen 8 en 9 en aanvullende noot), maar een bias in de cognitiegenen (maar niet leverfunctie en pigmentatiegenen) voor bijzonder grote eiwitten (>1.000 aminozuren in lengte) werd gevonden (aanvullende Fig. 7, aanvullende tabel 10 en aanvullende noot). Het plotten van genverliezen op de fylogenetische boom toonde aan dat het behoud van cognitiegenen reeds kort na TGD en vóór de diversificatie van de teleoesten vaststond. Deze bevinding ondersteunt de hypothese dat paraloge retentie vanaf het TGD-gebeuren het hoge niveau van gedragscomplexiteit in Xiphophorus en andere teleoesten kan hebben ondersteund.

Figuur 5: Differentiële retentie van genduplicaten in cognitie, pigmentatie en lever functionele klassen in teleoesten na TGD.
figure5

(a) Retentiepercentages voor TGD-afgeleide duplicaten van genen die verband houden met cognitie, pigmentatie en leverfunctie in zeven genomen van teleosts. Tijdstippen tijdens de evolutie van de teleost waarbij de lijn die tot Xiphophorus leidt betrokken is, zijn met elkaar verbonden door lijnen. (b) Fylogenetische kartering van genverliezen voor 190 paren cognitie-gerelateerde genduplicaten na TGD. Verliezen zijn aangegeven met negatieve waarden. Het aantal behouden TGD paraloog paren voor elk individueel teleost genoom wordt tussen haakjes gegeven. TGD paraloog verliezen werden in kaart gebracht op de teleost fylogenie geleverd door Setiamarga et al.39 volgens het parsimony principe. Het TGD-gebeurtenis werd op 350 miljoen jaar geleden gesteld. De retentiegraad van TGD-paralogen wordt gedefinieerd door het aantal paren van TGD-afgeleide duplicaten dat in een specifieke lineage aanwezig is, gedeeld door het aantal paren van TGD-afgeleide duplicaten dat ten tijde van TGD18 aanwezig was.

De genoomsequentie van de platyvis en de analyse daarvan hebben nieuwe perspectieven opgeleverd voor diverse prominente kenmerken van dit vismodel, waaronder zijn levendbarende voortplantingswijze, variatie in pigmentatiepatronen, evolutie van geslachtschromosomen in actie, complex gedrag en zowel spontane als geïnduceerde carcinogenese17. Teleosts domineren de bestaande visfauna, en, binnen de teleosts (Fig. 1b), is de Poeciliidae familie, inclusief platyfish, zwaarddragers, guppies en mollies, een paradigma van dit brede spectrum van adaptaties. Onze studie van dit eerste genoom van een poeciliide vis belicht enkele teleost evolutionaire aanpassingen en biedt een belangrijke bron om de studie van melanoom en andere segregerende fenotypes te bevorderen.