Il genoma dell’ornitorinco, Xiphophorus maculatus, fornisce intuizioni sull’adattamento evolutivo e diversi tratti complessi
Abbiamo sequenziato l’intero genoma di una singola femmina di ornitorinco (XX, 2n = 46 cromosomi, ceppo Jp163A; Fig. 1) dalla generazione 104 di accoppiamenti continui fratello-sorella. La copertura totale della sequenza di 19,6 volte (nota supplementare) ha prodotto un assemblaggio con N50 contig e supercontig lunghezze di 22 kb e 1,1 Mb, rispettivamente (Tabella 1 supplementare). Gli errori di assemblaggio, per lo più inserzioni o delezioni di un singolo nucleotide, sono stati corretti con Illumina paired-end legge. Un totale di 669 Mb della lunghezza stimata del genoma di 750-950 Mb è stato assemblato in contigs. Le predizioni geniche hanno identificato 20.366 geni codificanti, 348 geni non codificanti e 28 pseudogeni (Nota supplementare).
Come in altri teleostei, gli elementi trasponibili (TEs) in ornitorinco erano molto diversi, comprese molte famiglie assenti nei mammiferi1 e negli uccelli (Figg. 1-3 supplementari, Tabelle supplementari 2 e 3 e Nota supplementare). Abbiamo scoperto che 4.8% del trascrittoma è stato derivato da sequenze TE che rappresentano circa 40 famiglie diverse, indicando che molti dei TE dei pesci orata sono molto probabilmente ancora attivi. I TE più attivi sono stati i trasposoni del DNA Tc1 (>16.000 copie), seguiti dalla famiglia RTE (>9.000 copie). In particolare, abbiamo identificato diverse copie quasi intatte che codificano la busta di un retrovirus schiumoso (Spumaviridae) integrato nel genoma del pesce orata (Fig. 2). I virus schiumosi sono noti come agenti infettivi esogeni nei mammiferi2. Solo recentemente sono state descritte sequenze di virus schiumosi endogeni che possono essere utilizzati per rappresentare un record fossile di infezioni nei genomi del bradipo3 e aye-aye4 nei mammiferi e nel celacanto5. Una sequenza simile al virus schiumoso nello zebrafish6, una sequenza nel merluzzo scoperto durante questo lavoro e la sequenza del genoma del pesce ornitorinco qui riportata mostrano uno spettro ancora più ampio di ospiti. La filogenesi molecolare dei virus schiumosi è coerente con la filogenesi degli ospiti (Fig. 2). Questo risultato supporta la nozione di un’antica origine evolutiva marina di questo tipo di virus, con possibile coevoluzione ospite-virus5. Le copie quasi intatte di virus schiumoso trovato nei genomi di alcune specie di pesci divergenti, assenti da altri genomi di pesci sequenziati, potrebbe indicare introduzioni germinali indipendenti attraverso l’infezione. Il virus schiumoso esogeno non era stato descritto nei pesci; tuttavia, i nostri risultati suggeriscono che i virus schiumosi esogeni sono stati e potrebbero essere ancora infettivi nella stirpe dei pesci.
Le mappe di omologia cromosomica dei mammiferi mostrano una disposizione patchwork di circa 35 grandi blocchi conservati di sintenia in media (ma circa 80 nel cane e 200 nel topo) e numerosi piccoli blocchi assemblati in diverse combinazioni tra le varie specie e che coprono oltre 90 milioni di anni di evoluzione7. Abbiamo costruito la mappa genetica meiotica più estesa per qualsiasi vertebrato ancora pubblicato, che ha permesso l’ordinamento di X. maculatus scaffold e precisa analisi conservato synteny confrontando genomi di pesce (Nota supplementare). Abbiamo usato l’innovativo approccio RAD (restriction site-associated DNA)-tag8 per costruire una mappa meiotica composta da 16.245 marcatori polimorfici che definiscono 24 gruppi di collegamento equivalente al numero di cromosomi aploidi dell’ornitorinco9. Così, il 90,17% delle sequenze totali in contigs potrebbe essere assegnato una posizione cromosomica. Confronti a lungo raggio dell’ordine dei geni tra le specie10 hanno identificato nuove relazioni evolutive tra i pesci orata e altri cromosomi di teleostei. Medaka, il parente più vicino con un genoma sequenziato, ha anche 24 cromosomi, e 19 di questi hanno mostrato una stretta relazione uno-a-uno con i cromosomi orata (Fig. 3a,b). I rimanenti cinque cromosomi di ornitorinco erano anch’essi ortologhi di un singolo cromosoma di medaka, con l’eccezione di uno o due brevi segmenti (∼1 Mb di lunghezza) che si trovavano su un altro cromosoma di medaka (Fig. 3c e Fig. 4 supplementare). Così, un bel po’ di traslocazioni, tutte molto brevi, hanno interrotto i cariotipi dalla divergenza del medaka e degli ornitorinchi 120 milioni di anni fa11,12. Un quadro simile è emerso dal confronto dei cromosomi degli ornitorinchi con quelli dello spinarello (divergenza 180 milioni di anni fa)11,12. Questi risultati dettagliano l’ampia misura precedentemente sconosciuta in cui il contenuto genetico dei cromosomi in questi teleostei è stato conservato in quasi 200 milioni di anni di evoluzione, una conservazione molto maggiore di quella trovata nei mammiferi in circa la metà di quel tempo7,11,12. Questo è un po’ inaspettato, dato l’evento di duplicazione del genoma dei teleostei (TGD), perché si sarebbe potuto pensare che l’accoppiamento illegittimo di cromosomi paraloghi (derivante dal TGD) avrebbe potuto facilitare le traslocazioni. I meccanismi che possono aver mitigato tali traslocazioni rimangono sconosciuti.
L’ornitorinco è un modello ben noto nella ricerca sul cancro13. Il suo genoma contiene una regione di controllo del tumore (TCR), compreso l’oncogene xmrk14 che innesca lo sviluppo del melanoma. Il TCR contiene anche il modificatore tumorale mdl15,16. Le varianti alleliche mdl controllano il comparto corporeo, il tempo di insorgenza e la gravità dei tumori17. Inoltre, gli alleli mdl si manifestano nei pesci orata come un’alta diversità di modelli di pigmento geneticamente definiti. Il genoma mappato ci ha permesso di escludere molti geni del pigmento come fattori responsabili di queste varianti di pigmento associate al sesso e modificatori del melanoma. Tutti i geni noti del pigmento18 erano presenti nel genoma dell’ornitorinco femmina XX; quindi, nessuno è specifico del cromosoma Y. Solo 6 dei 174 geni noti del pigmento (asip2a, egfrb, muted, myca, rps20 e tfap2a) erano situati sul cromosoma X (Xma21). Di questi sei, solo il proto-oncogene egfrb risiedeva abbastanza vicino all’oncogene del melanoma xmrk (tabella 4 supplementare) da essere considerato un gene candidato per mdl. Infatti, studi biochimici hanno dimostrato che Egfrb può cooperare con Xmrk19, ma i livelli di espressione di questi geni sono regolati inversamente nel melanoma20. Ulteriori studi sono necessari per valutare la funzione di Egfrb e per trovare altri candidati geni della pigmentazione non classica in questa regione genomica che possono controllare sia il modello di pigmento che il fenotipo del melanoma.
Un altro componente genetico finora non identificato del modello di melanoma dello Xiphophorus è il gene R/Diff. R/Diff sopprime la formazione del melanoma negli ornitorinchi selvatici, e l’eliminazione della sua espressione tramite ibridazione interspecie permette la crescita del tumore. R/Diff è stato mappato in un intervallo di 10-cM su Xma5 vicino al locus cdkn2a/b21. Nonostante il gene CDKN2A umano sia un gene soppressore tumorale ben descritto in alcuni melanomi umani22, cdkn2a/b è stato escluso dall’essere R/Diff perché non è mutato ma è invece sovraespresso nel modello di melanoma Xiphophorus23. La sequenza Xma5 definisce ora un certo numero di geni candidati R/Diff per ulteriori esplorazioni. Per esempio, lo scaffold 182 (1.085.500 bp), che ospita cdkn2a/b, contiene diversi geni con un alto potenziale di avere un ruolo di soppressore del tumore R/Diff (per esempio, tet2, cxxc4, mtap, topo-rs, mdx4 e pdcd4a). In alternativa, la regione può rappresentare un locus complesso che comprende diversi geni che agiscono in modo sinergico o compensatorio per regolare l’oncogene xmrk, coerentemente con i precedenti rapporti di carcinogenesi spontanea e indotta nei molti modelli di tumore ibrido interspecie Xiphophorus24,25,26.
Viviparity è una modalità riproduttiva elaborata che coinvolge diversi livelli di investimento materno nella prole, che vanno dalla fornitura di uova completamente prima della fecondazione e conservando loro attraverso lo sviluppo a minimamente fornire le uova prima della fecondazione e fornendo loro dopo la fecondazione attraverso una placenta, come nei mammiferi. La famiglia dei pesci Poeciliidae, un clade monofiletico di più di 260 specie27, è inusuale in quanto include specie che coprono lo spettro da un apporto trascurabile a uno esteso dopo la fecondazione28,29. Il genoma dell’ornitorinco è il primo di un vertebrato viviparo non-mammifero. Abbiamo eseguito l’analisi in pesci ornitorinco così come in un secondo pesce vivipari, il Xiphophorus hellerii spada, entrambi i quali hanno ben provisioning uova prima della fecondazione30,31, di 3 gruppi di geni viviparity (tuorlo, placenta e geni cappotto uovo; n = 34) per la perdita del gene e selezione positiva rispetto a 4 specie di teleostei deposizione delle uova (medaka, tetraodon, spinarello e pesce zebra).
Nei mammiferi, l’aumento della viviparità è stato proposto per coinvolgere la perdita progressiva di vitellogenine (precursori del tuorlo)32. In pesce ornitorinco e coda di rospo, tutti i geni relativi al tuorlo (vitellogenine e loro trasportatori/recettori; Tabella supplementare 5) erano presenti e si è evoluto sotto selezione purificante, coerente con entrambe le specie completamente provisioning uova prima della fecondazione, con l’eccezione di un gene che si è evoluto sotto selezione positiva, vitellogenin1 (Supplementary Fig. 5a).
Tre dei 13 geni platyfish, i cui ortologhi mammiferi sono legati allo sviluppo della placenta, si è evoluto sotto selezione positiva (Fig. 4a, Supplementary Fig. 5b-d e Supplementary Table 5). Igf2, che nel topo regola la permeabilità della placenta33, si è evoluto sotto forte selezione positiva in ornitorinco (Fig. 4a), che ha particolarmente colpito la regione distale al sito di proteolisi. La sequenza igf233 era disponibile anche da un altro poeciliide, il topminnow del deserto Poeciliopsis lucida, che condivide un antenato livebearing con specie Xiphophorus ma differisce in aver evoluto placentazione recentemente. Nel topminnow del deserto, la stessa regione come in platyfish evoluto sotto selezione positiva, ma la selezione era ancora più forte (Supplementary Fig. 5b), suggerendo in corso l’evoluzione adattativa molecolare in quanto i due generi contenenti questi pesci divergevano diversi milioni di anni fa. Gli altri due geni placentari, pparg e ncoa6, avevano più regioni con segnali di selezione positiva al di fuori dei domini funzionali noti, suggerendo nuove regioni importanti per la viviparità. Gli stessi geni sotto selezione nei pesci vivipari, tuttavia, non hanno mostrato firme di selezione positiva quando sono stati analizzati i geni omologhi dell’ornitorinco che depone le uova e dei marsupiali e dei mammiferi placentari (Tabella 6 supplementare). Questo risultato è in linea con il fatto che le placente dei mammiferi e dei pesci sono strutture convergenti ma non omologhe.
I geni della Zona pellucida (Zpc), che producono un rivestimento ricco di glicoproteine che circonda la membrana plasmatica dell’ovocita, hanno mostrato i cambiamenti più marcati. Al contrario, la coriogeninaH minore, la coriolisinaL, la coriolisinaH e la zvep si sono evolute sotto selezione positiva (Fig. 4b, Fig. 5e-g supplementare e Tabella 5 supplementare). In Xenopus laevis, i geni Zpc controllano il legame specie-specifico dello sperma e aiutano a garantire che solo lo sperma conspecifico rilasciato nell’ambiente acquoso fertilizza le uova34. Pesci vivipari, tuttavia, hanno fecondazione interna, dove specie-specifico riconoscimento sperma non sarebbe così cruciale. Rispetto ai pesci che depongono le uova, il guscio delle uova in questi pesci dovrebbe essersi adattato allo sviluppo all’interno della madre, in quanto non è più essenziale per la protezione ma deve facilitare lo scambio di gas e materiale. I geni degli enzimi di schiusa zvep e choriolysinH hanno mostrato siti di rapida evoluzione generalmente situati adiacenti ai domini catalitici (Fig. 4f,g supplementare), indicando che, durante l’evoluzione della viviparità, questi enzimi potrebbero aver alterato le interazioni con proteine bersaglio o di regolazione. In particolare, nella coriogeninaH minore, le stesse regioni, in particolare nel dominio della zona pellucida, si sono evolute sotto selezione positiva sia nei mammiferi che nei pesci (Fig. 4b). Questo è un esempio evidente di come l’evoluzione convergente a livello molecolare si manifesta a livello fisiologico e infine morfologico.
Le nostre analisi delle conseguenze della TGD hanno scoperto una classe funzionale di geni che ha suscitato il nostro interesse perché i pesci Xiphophorus in particolare e i teleostei in generale mostrano un pronunciato alto livello di complessità comportamentale35 che altri gruppi di vertebrati ‘a sangue freddo’ come gli anfibi e i rettili non raggiungono. Usando il genoma dell’ornitorinco e le annotazioni dei geni di altri sei teleostei sequenziati, ci siamo chiesti se la ritenzione dei geni duplicati dall’evento TGD potesse produrre attraverso la subfunzionalizzazione (ritenzione differenziale di sottofunzioni ancestrali) e/o la neofunzionalizzazione (acquisizione di nuove sottofunzioni)36 l’acquisizione di comportamenti più complessi. Abbiamo confrontato 190 geni legati alla cognizione (Tabella supplementare 7 e Nota supplementare) con quelli coinvolti nella pigmentazione (133 geni, per i quali repertori genici aumentati sono stati collegati all’elevata complessità e diversità della colorazione dei teleostei) e funzioni epatiche (187 geni)18 come controlli. L’analisi dei geni legati alla cognizione ha mostrato un alto tasso di ritenzione dei duplicati del 45% nei pesci orata e valori simili in altri teleostei (Fig. 5 e Fig. 6 supplementare) rispetto ai tassi visti per i geni legati alla pigmentazione (30%) e funzione epatica (15%). Il tasso medio di ritenzione dei duplicati su tutti i geni nei genomi dei teleostei è stimato al 12-24% (rif. 37). Non abbiamo trovato alcun bias nei geni di tutte e tre le categorie funzionali (cognizione, pigmentazione e funzione epatica) che sono stati mantenuti dopo TGD a causa della sensibilità al dosaggio o appartenenza complesso proteico (tabelle supplementari 8 e 9 e nota supplementare), ma un bias nei geni cognizione (ma non funzione epatica e geni pigmentazione) per le proteine particolarmente grandi (> 1.000 aminoacidi di lunghezza) è stato trovato (Supplementary Fig. 7, tabella supplementare 10 e nota supplementare). Tracciare le perdite di geni sull’albero filogenetico ha mostrato che il mantenimento dei geni della cognizione era già fissato poco dopo la TGD e prima della diversificazione dei teleostei. Questo risultato supporta l’ipotesi che la ritenzione di paraloghi dall’evento TGD può aver sostenuto l’alto livello di complessità comportamentale in Xiphophorus e altri teleostei.
La sequenza e l’analisi del genoma dell’ornitorinco hanno fornito nuove prospettive per diverse caratteristiche importanti di questo modello di pesce, tra cui la sua modalità riproduttiva vivente, la variazione dei modelli di pigmentazione, l’evoluzione del cromosoma sessuale in azione, il comportamento complesso e la carcinogenesi sia spontanea che indotta17. I teleostei dominano la fauna ittica esistente e, all’interno dei teleostei (Fig. 1b), la famiglia Poeciliidae, che comprende pesci orata, portaspada, guppy e molly, è un paradigma di questo ampio spettro di adattamenti. Il nostro studio di questo primo genoma di un pesce poeciliide illumina alcuni adattamenti evolutivi dei teleostei e fornisce una risorsa importante per avanzare lo studio del melanoma e di altri fenotipi segreganti.