Articles

Genomet hos flodkräftan Xiphophorus maculatus ger insikter om evolutionär anpassning och flera komplexa egenskaper

Vi har sekvenserat hela genomet hos en enda flodkräftshona (XX, 2n = 46 kromosomer, Jp163A-stam; fig. 1) från generation 104 av kontinuerliga bror-syster parningar. Den totala sekvenstäckningen på 19,6 gånger (kompletterande anmärkning) gav en samling med N50 contig- och supercontig-längder på 22 kb respektive 1,1 Mb (kompletterande tabell 1). Fel i sammansättningen, främst singelnukleotidinsatser eller -deletioner, korrigerades med Illumina-avläsningar med parvisa ändar. Sammanlagt 669 Mb av den uppskattade genomlängden på 750-950 Mb samlades i contigs. Genprediktioner identifierade 20 366 kodande gener, 348 icke-kodande gener och 28 pseudogener (kompletterande anmärkning).

Figur 1: Platyfisk, X. maculatus.
figure1

(a) Kvinnlig (överst) och manlig (nederst) platyfish, av stam Jp163A med svarta pigmentfläckar på ryggfenan som utvecklas när aktiviteten hos en X-kromosomal onkogen kontrolleras på lämpligt sätt. I hybridgenotyper äventyras denna kontroll och malignt melanom utvecklas från fläckarna. (b) Flodkräftans fylogenetiska position i förhållande till andra fiskarter.

Som hos andra teleoster var transposerbara element (TE) hos flodkräftan mycket varierande, inklusive många familjer som saknas hos däggdjur1 och fåglar (kompletterande figurer 1-3, kompletterande tabeller 2 och 3 samt kompletterande anmärkning). Vi fann att 4,8 % av transkriptomet härrörde från TE-sekvenser som representerar cirka 40 olika familjer, vilket tyder på att många av platyfiskens TE:er sannolikt fortfarande är aktiva. De mest aktiva TE:erna var Tc1 DNA-transposoner (>16 000 kopior), följt av RTE-familjen (>9 000 kopior). Särskilt noterbart är att vi identifierade flera nästan intakta kuvertkodande kopior av ett skummande retrovirus (Spumaviridae) som är integrerat i platyfiskens genom (fig. 2). Skummande virus är kända som exogena smittämnen hos däggdjur2. Först nyligen har endogena sekvenser av skumvirus som kan användas för att representera en fossil dokumentation av infektioner beskrivits i genomet hos däggdjurens sloth3 och aye-aye4 och i coelacanthen5. En skumvirusliknande sekvens i zebrafiskar6, en sekvens i torsk som upptäcktes under detta arbete och den genomsekvens för platyfiskar som rapporteras här visar på ett ännu bredare spektrum av värddjur. Den molekylära fylogenin för skumvirus överensstämmer med värdfylogenin (fig. 2). Detta resultat stöder idén om ett gammalt marint evolutionärt ursprung för denna typ av virus, med möjlig samevolution mellan värd och virus5. De nästan intakta kopior av skumvirus som hittats i genomet hos vissa divergerande fiskarter, som saknas i andra sekvenserade fiskgenom, kan tyda på oberoende germinaintroduktioner genom infektion. Exogent skumvirus hade inte beskrivits hos fiskar, men våra resultat tyder på att exogena skumvirus har varit och fortfarande kan vara infektiösa i fiskens släktled.

Figur 2: Fylogenetiskt träd för endogena retrovirus baserat på sekvenser av proteiner för omvänt transkriptas.
figure2

Foamyvirus (FV)-sekvenser (ljusblå skuggning) bildar två distinkta fylogenetiska grupper, en tetrapodspecifik och en teleostspecifik. Båda grupperna innehåller endogena sekvenser av foamy virus (EFV) (de nyss identifierade sekvenserna av platyfish och torsk är markerade med mörkblå skuggning). Anpassningen utfördes med ClustalW (223 aminosyror) och det fylogenetiska trädet konstruerades med PhyML-paketet med hjälp av maximum-likelihood-metoder38 med standardbootstrap (visas i början av grenarna) och optimerade beräkningsalternativ. FV, foamy virus; MuERV-L, Mus musculus endogenous retrovirus-L; BAEV, baboon endogenous virus; FENV1, feline endogenous virus 1; EFV, endogenous foamy virus; MLV, murint leukemivirus; HERV-K, humant endogent retrovirus-K; MMTV, mouse mammary tumor virus; HIV-1, human immunodeficiency virus-1. Skalstrecket representerar antalet substitutioner per plats.

Homologikartor över däggdjurskromosomer visar ett lapptäcke av i genomsnitt cirka 35 stora bevarade syntenyblock (men cirka 80 hos hund och 200 hos mus) och ett stort antal små block som är sammanställda i olika kombinationer bland de olika arterna och som sträcker sig över 90 miljoner år av evolution7. Vi konstruerade den mest omfattande meiotiska genetiska kartan för något ryggradsdjur som hittills har publicerats, vilket gjorde det möjligt att ordna X. maculatus-ställningar och göra exakta analyser av bevarade syntenier genom att jämföra fiskgenom (kompletterande anmärkning). Vi använde den innovativa metoden med restriktionsplatsassocierat DNA (RAD)-tag8 för att konstruera en meiotisk karta som består av 16 245 polymorfa markörer som definierar 24 kopplingsgrupper som motsvarar det haploida kromosomantalet hos flodkräftan9. Således kunde 90,17 % av de totala sekvenserna i contigs tilldelas en kromosomal position. Långsiktiga jämförelser av genernas ordning mellan olika arter10 identifierade nya evolutionära relationer mellan platyfish och andra teleostkromosomer. Medaka, den närmaste släktingen med ett sekvenserat genom, har också 24 kromosomer, och 19 av dessa uppvisade ett strikt ett-till-ett-förhållande med flodkräftans kromosomer (fig. 3a, b). De återstående fem platyfiskromosomerna var också var och en ortolog till en enda medakakromosom, med undantag för ett eller två korta segment (∼1 Mb i längd) som fanns på en annan medakakromosom (fig. 3c och kompletterande fig. 4). Således har ganska många translokationer, alla mycket korta, stört karyotyperna sedan divergensen mellan medaka och flodkräfta för 120 miljoner år sedan11,12. En liknande bild framkom vid jämförelser av kromosomerna hos flodkräfta med kromosomerna hos pigghaj (divergens för 180 miljoner år sedan)11,12. Dessa resultat beskriver den tidigare okända breda omfattning i vilken det genetiska innehållet i kromosomerna hos dessa teleoster har bevarats under nästan 200 miljoner år av evolution, ett bevarande som är mycket större än vad som har hittats hos däggdjur under ungefär halva den tiden7,11,12. Detta är något oväntat med tanke på teleosternas duplikation av genomet (TGD), eftersom man kunde ha trott att den illegitima parningen av paraloga kromosomer (som uppstod vid TGD) skulle ha underlättat translokationer. De mekanismer som kan ha mildrat sådana translokationer är fortfarande okända.

Figur 3: Konserverade synteser mellan platyfish och medaka.
figure3

(a) Medaka-ortologerna av gener på X. maculatus kromosom 9 (Xma9) tenderar att ligga på Oryzias latipes kromosom 4 (Ola4), vilket visar att det geniska innehållet i dessa kromosomer har förblivit intakt utan några translokationer under de 120 miljoner år som förflutit sedan dessa arters linjer skiljdes åt. Varje grå prick längs den horisontella axeln med beteckningen Xma9 representerar positionen för en platyfish-gen vars medaka-ortolog (enligt bedömning av ömsesidig best-BLAST-träffanalys) ligger direkt vertikalt till Xma9-genen, plottat på lämplig medaka-kromosom10. (b) Omvänt ligger nästan alla platyfish-ortologer till gener på medaka-kromosomen Ola4 på Xma9. (c) Nästan alla medaka-ortologer till Xma19 ligger på Ola22, med undantag för ett cirka 1 Mb långt segment vid position 20 Mb på Ola22 som förekommer på Ola24 (streckad ruta).

Plattkräftan är en välkänd modell inom cancerforskning13. Dess genom innehåller en tumörkontrollregion (TCR), inklusive onkogenen xmrk14 som utlöser melanomutveckling. TCR innehåller också tumörmodifieraren mdl15,16. Alleliska varianter av mdl styr kroppskompartimentet, tidpunkten för tumörernas uppkomst och svårighetsgrad17. Dessutom manifesterar mdl-alleler sig hos flodkräftor som en stor mångfald av genetiskt definierade pigmentmönster. Det kartlagda genomet gjorde det möjligt för oss att utesluta många pigmentgener som ansvariga faktorer för dessa könsassocierade pigmentvarianter och melanommodifierare. Alla kända pigmentgener18 fanns i XX-honornas platyfiskgenom; ingen av dem är alltså specifik för Y-kromosomen. Endast 6 av de 174 kända pigmentgenerna (asip2a, egfrb, muted, myca, rps20 och tfap2a) fanns på X-kromosomen (Xma21). Av dessa sex var det bara proto-onkogenen egfrb som låg tillräckligt nära melanomonkogenen xmrk (kompletterande tabell 4) för att betraktas som en kandidatgen för mdl. Biokemiska studier har faktiskt visat att Egfrb kan samarbeta med Xmrk19, men uttrycksnivåerna för dessa gener regleras omvänt i melanom20. Ytterligare studier behövs för att utvärdera egfrb-funktionen och för att hitta andra kandidater för icke-klassiska pigmenteringsgener i denna genomiska region som kan kontrollera både pigmentmönster och melanomfenotyp.

En annan hittills oidentifierad genetisk komponent i Xiphophorus melanommodell är R/Diff-genen. R/Diff undertrycker melanombildningen hos vilda platyfiskar, och eliminering av dess uttryck genom hybridisering mellan arter möjliggör tumörtillväxt. R/Diff kartlades till ett 10-cM-intervall på Xma5 nära cdkn2a/b locus21. Trots att den ortologa humana CDKN2A-genen är en väl beskriven tumörsuppressorgen i vissa humana melanom22, utesluts cdkn2a/b från att vara R/Diff eftersom den inte är muterad utan i stället överuttrycks i Xiphophorus melanommodell23. Xma5-sekvensen definierar nu ett antal R/Diff-kandidatgener för vidare utforskning. Till exempel innehåller scaffold 182 (1 085 500 bp), som hyser cdkn2a/b, flera gener med hög potential att ha en roll som R/Diff-tumörsuppressor (till exempel tet2, cxxc4, mtap, topo-rs, mdx4 och pdcd4a). Alternativt kan regionen utgöra ett komplext locus som omfattar flera gener som verkar på ett synergistiskt eller kompensatoriskt sätt för att reglera xmrk-onkogenen, vilket stämmer överens med tidigare rapporter om spontan och inducerad karcinogenes i de många Xiphophorus interspecies hybrid-tumörmodellerna24,25,26.

Viviparitet är ett utarbetat reproduktionssätt som inbegriper olika nivåer av moderns investeringar i avkomman, allt från att fullt ut förse ägg före befruktning och behålla dem under hela utvecklingen till att minimalt förse ägg före befruktning och förse dem efter befruktning via en placenta, som hos däggdjur. Fiskfamiljen Poeciliidae, som är en monofyletisk klunga med mer än 260 arter27 , är ovanlig eftersom den innehåller arter som spänner över spektrumet från obetydlig till omfattande försörjning efter befruktning28,29 . Platyfiskens genom är det första från ett levande levande ryggradsdjur som inte är däggdjur. Vi utförde en analys i platyfish samt i en andra levande födande fisk, swordtail Xiphophorus hellerii, som båda har väl försedda ägg före befruktning30,31, av 3 grupper av viviparitetsgener (äggula, placenta och ägghölje gener; n = 34) för genförlust och positiv selektion jämfört med 4 arter av äggläggande teleosts (medaka, tetraodon, pigghake och zebrafisk).

I däggdjur har det föreslagits att uppkomsten av viviparitet innebär en progressiv förlust av vitellogeniner (äggulaprekursorer)32. I platyfish och swordtail fanns alla äggultrelaterade gener (vitellogeniner och deras transportörer/receptorer; kompletterande tabell 5) och utvecklades under renande urval, vilket stämmer överens med att båda arterna tillhandahåller ägg fullt ut före befruktning, med undantag för en gen som utvecklades under positivt urval, vitellogenin1 (kompletterande figur 5).

Tre av 13 plattfiskgener, vars ortologer från däggdjur är relaterade till placentautveckling, utvecklades under positivt urval (Fig. 4a, Supplementary Fig. 5b-d och Supplementary Table 5). Igf2, som hos musen reglerar placentas genomsläpplighet33 , utvecklades under starkt positivt urval hos platyfish (fig. 4a), vilket särskilt påverkade regionen distalt från proteolysplatsen. Igf2-sekvensen33 fanns också tillgänglig från en annan poeciliid, ökenmusslan Poeciliopsis lucida, som delar en levande bärande förfader med Xiphophorus-arter, men som skiljer sig genom att ha utvecklat placentation nyligen. Hos ökenmyntan utvecklades samma region som hos platyfish under positivt urval, men urvalet var ännu starkare (kompletterande figur 5b), vilket tyder på pågående molekylär adaptiv evolution sedan de två släkten som innehåller dessa fiskar skiljde sig åt för flera miljoner år sedan. De två andra placentagenerna, pparg och ncoa6, hade flera regioner med signaler för positivt urval utanför kända funktionella domäner, vilket tyder på nya regioner som är viktiga för viviparitet. Samma gener under urval i levande födande fiskar uppvisade dock inte positiva selektionssignaturer när ortologer från äggläggande platypus och från pungdjur och placentala däggdjur analyserades (kompletterande tabell 6). Detta resultat är i linje med att placenta hos däggdjur och fiskar är konvergerande men inte homologa strukturer.

Figur 4: Posteriora sannolikheter för platsklasser enligt alternativa modeller längs genen för varje aminosyraplats beräknade med Bayes empiriska Bayes-analys.
figure4

Sajter av klass 1 är under renande urval (Ka/Ks-förhållandet ∼0), platser av klass 2 är under neutralt urval (Ka/Ks-förhållandet ∼1) och platser av klass 3 är under positivt urval hos Xiphophorus-arter. (a) Insulinliknande tillväxtfaktor 2 (IGF2). Färgade staplar under diagrammet visar kända funktionella domäner, och pilen visar proteolysplatsen (mellan resterna 118 och 119). (b) ChoriogeninH minor. Överst, jämförelse mellan äggläggande och levande födande fiskar. Nederst, jämförelse mellan placenta-däggdjur och icke-placenta-däggdjur. Samma regioner är under positivt urval hos fiskar och däggdjur.

Zona pellucida (Zpc)-gener, som producerar ett glykoproteinrikt hölje som omger äggcellens plasmamembran, uppvisade de mest uttalade förändringarna. alveolin försvann från platyfiskens genom. Omvänt utvecklades choriogeninH minor, choriolysinL, choriolysinH och zvep under positivt urval (fig. 4b, kompletterande fig. 5e-g och kompletterande tabell 5). I Xenopus laevis kontrollerar Zpc-gener artspecifik spermabindning och bidrar till att säkerställa att endast artfrämmande spermier som släpps ut i vattenmiljön befruktar äggen34. Viviparösa fiskar har dock intern befruktning, där artspecifik spermierekognition inte skulle vara lika avgörande. Jämfört med äggläggande fiskar förväntas äggskalet hos dessa fiskar ha anpassat sig till utvecklingen inuti modern, eftersom det inte längre är nödvändigt för att skydda utan måste underlätta gas- och materialutbyte. Kläckningsenzymgenerna zvep och choriolysinH uppvisade snabbutvecklade platser som i allmänhet var belägna intill de katalytiska domänerna (kompletterande figur 4f,g), vilket tyder på att dessa enzymer under viviparitetens utveckling kan ha förändrat interaktionerna med mål- eller regleringsproteiner. I choriogeninH minor utvecklades samma regioner, särskilt i zona pellucida-domänen, under positivt urval hos både däggdjur och fiskar (fig. 4b). Detta är ett påtagligt exempel på hur konvergent evolution på molekylär nivå manifesterar sig på fysiologisk och i slutändan morfologisk nivå.

Våra analyser av konsekvenserna av TGD avslöjade en funktionell klass av gener som väckte vårt intresse eftersom Xiphophorusfiskar i synnerhet och teleostfiskar i allmänhet uppvisar en utpräglat hög nivå av beteendekomplexitet35 som andra grupper av ”kallblodiga” ryggradsdjur, t.ex. amfibier och reptiler, inte uppnår. Med hjälp av platyfiskens genom och genannotationer från sex andra sekvenserade teleoster frågade vi oss om dubbelt genbevarande från TGD-händelsen skulle kunna ge upphov till mer komplexa beteenden genom subfunktionalisering (differentiellt bevarande av förfädernas underfunktioner) och/eller neofunktionalisering (förvärv av nya underfunktioner)36 . Vi jämförde 190 kognitionsrelaterade gener (kompletterande tabell 7 och kompletterande anmärkning) med de gener som är involverade i pigmentering (133 gener, för vilka ökade genrepertoarer har kopplats till den höga komplexiteten och mångfalden av teleosters färgning) och leverfunktioner (187 gener)18 som kontroller. Analysen av kognitionsrelaterade gener visade en hög bibehållningsgrad av duplikat på 45 % hos flodkräfta och liknande värden hos andra teleoster (fig. 5 och kompletterande fig. 6) jämfört med de nivåer som observerades för gener som är relaterade till pigmentering (30 %) och leverfunktioner (15 %). Den genomsnittliga dubbleringsfrekvensen för alla gener i teleostgenom uppskattas till 12-24 % (ref. 37). Vi fann ingen bias i gener från alla tre funktionella kategorier (kognition, pigmentering och leverfunktion) som behölls efter TGD på grund av doseringskänslighet eller tillhörighet till proteinkomplex (kompletterande tabeller 8 och 9 och kompletterande anmärkning), men en bias i kognitionsgenerna (men inte i generna för leverfunktion och pigmentering) för särskilt stora proteiner (>1 000 aminosyror i längd) hittades (kompletterande figur 7, kompletterande tabell 10 och kompletterande anmärkning). Plottning av genförluster på det fylogenetiska trädet visade att kognitionsgenbehållningen var fixerad redan strax efter TGD och före teleostdiversifieringen. Detta fynd stödjer hypotesen att paralogbehållning från TGD-händelsen kan ha stöttat den höga nivån av beteendekomplexitet hos Xiphophorus och andra teleoster.

Figur 5: Differentiell bibehållning av gendubbletter inom kognition, pigmentering och funktionsklasser i levern hos teleosterna efter TGD.
figure5

(a) Bibehållningsgrad för TGD-avledda duplikat av gener relaterade till kognition, pigmentering och leverfunktion i sju teleostgenom. Tidpunkter under teleostens evolution som involverar den släkt som leder till Xiphophorus är sammanlänkade med linjer. (b) Fylogenetisk kartläggning av genförluster för 190 par kognitionsrelaterade gendubbletter efter TGD. Förluster anges med negativa värden. Antalet bibehållna TGD-paralogpar för varje enskilt teleostgenom anges inom parentes. TGD-paralogförlusterna kartlades på teleostfylogenin som tillhandahölls av Setiamarga et al.39 enligt principen om sparsamhet. TGD-händelsen fastställdes till 350 miljoner år sedan. Behållningen av TGD-paraloger definieras av antalet par av TGD-avledda duplikatpar som finns i en specifik släktlinje dividerat med antalet par av TGD-avledda duplikatpar som fanns vid tidpunkten för TGD18.

Plattfiskens genomsekvens och analys har gett nya perspektiv på flera framträdande egenskaper hos denna fiskmodell, bland annat dess fortplantningssätt med levande födda djur, variation i pigmenteringsmönster, könskromosomernas evolution i handling, komplext beteende och både spontan och inducerad karcinogenes17. Teleosterna dominerar den existerande fiskfaunan, och inom teleosterna (fig. 1b) är Poeciliidae-familjen, inklusive plattfiskar, svärdstjärtar, guppies och mollyer, ett paradigm för detta breda spektrum av anpassningar. Vår studie av detta första genom från en poeciliidfisk belyser vissa evolutionära anpassningar hos teleosterna och utgör en viktig resurs för att främja studiet av melanom och andra segregerande fenotyper.