Articles

Il genoma dell’ornitorinco, Xiphophorus maculatus, fornisce intuizioni sull’adattamento evolutivo e diversi tratti complessi

Abbiamo sequenziato l’intero genoma di una singola femmina di ornitorinco (XX, 2n = 46 cromosomi, ceppo Jp163A; Fig. 1) dalla generazione 104 di accoppiamenti continui fratello-sorella. La copertura totale della sequenza di 19,6 volte (nota supplementare) ha prodotto un assemblaggio con N50 contig e supercontig lunghezze di 22 kb e 1,1 Mb, rispettivamente (Tabella 1 supplementare). Gli errori di assemblaggio, per lo più inserzioni o delezioni di un singolo nucleotide, sono stati corretti con Illumina paired-end legge. Un totale di 669 Mb della lunghezza stimata del genoma di 750-950 Mb è stato assemblato in contigs. Le predizioni geniche hanno identificato 20.366 geni codificanti, 348 geni non codificanti e 28 pseudogeni (Nota supplementare).

Figura 1: L’ornitorinco, X. maculatus.
figure1

(a) Platyfish femmina (in alto) e maschio (in basso), del ceppo Jp163A con macchie di pigmento nero sulla pinna dorsale che si sviluppano quando l’attività di un oncogene del cromosoma X è opportunamente controllata. Nei genotipi ibridi, questo controllo è compromesso, e il melanoma maligno si sviluppa dalle macchie. (b) Posizione filogenetica dell’ornitorinco rispetto ad altre specie di pesci.

Come in altri teleostei, gli elementi trasponibili (TEs) in ornitorinco erano molto diversi, comprese molte famiglie assenti nei mammiferi1 e negli uccelli (Figg. 1-3 supplementari, Tabelle supplementari 2 e 3 e Nota supplementare). Abbiamo scoperto che 4.8% del trascrittoma è stato derivato da sequenze TE che rappresentano circa 40 famiglie diverse, indicando che molti dei TE dei pesci orata sono molto probabilmente ancora attivi. I TE più attivi sono stati i trasposoni del DNA Tc1 (>16.000 copie), seguiti dalla famiglia RTE (>9.000 copie). In particolare, abbiamo identificato diverse copie quasi intatte che codificano la busta di un retrovirus schiumoso (Spumaviridae) integrato nel genoma del pesce orata (Fig. 2). I virus schiumosi sono noti come agenti infettivi esogeni nei mammiferi2. Solo recentemente sono state descritte sequenze di virus schiumosi endogeni che possono essere utilizzati per rappresentare un record fossile di infezioni nei genomi del bradipo3 e aye-aye4 nei mammiferi e nel celacanto5. Una sequenza simile al virus schiumoso nello zebrafish6, una sequenza nel merluzzo scoperto durante questo lavoro e la sequenza del genoma del pesce ornitorinco qui riportata mostrano uno spettro ancora più ampio di ospiti. La filogenesi molecolare dei virus schiumosi è coerente con la filogenesi degli ospiti (Fig. 2). Questo risultato supporta la nozione di un’antica origine evolutiva marina di questo tipo di virus, con possibile coevoluzione ospite-virus5. Le copie quasi intatte di virus schiumoso trovato nei genomi di alcune specie di pesci divergenti, assenti da altri genomi di pesci sequenziati, potrebbe indicare introduzioni germinali indipendenti attraverso l’infezione. Il virus schiumoso esogeno non era stato descritto nei pesci; tuttavia, i nostri risultati suggeriscono che i virus schiumosi esogeni sono stati e potrebbero essere ancora infettivi nella stirpe dei pesci.

Figura 2: Albero filogenetico dei retrovirus endogeni basato sulle sequenze delle proteine della trascrittasi inversa.
figure2

Le sequenze del virus schiumoso (FV) (ombreggiatura azzurra) formano due gruppi filogenetici distinti, uno specifico per i tetrapodi e uno per i teleostei. Entrambi i gruppi contengono sequenze di virus schiumoso endogeno (EFV) (le sequenze di ornitorinco e merluzzo appena identificate sono evidenziate dall’ombreggiatura blu scuro). L’allineamento è stato effettuato con ClustalW (223 aminoacidi), e l’albero filogenetico è stato costruito con il pacchetto PhyML utilizzando metodi di massima verosimiglianza38 con bootstrap di default (mostrato all’inizio dei rami) e opzioni di calcolo ottimizzate. FV, foamy virus; MuERV-L, Mus musculus endogenous retrovirus-L; BAEV, baboon endogenous virus; FENV1, feline endogenous virus 1; EFV, endogenous foamy virus, MLV, murine leukemia virus; HERV-K, human endogenous retrovirus-K; MMTV, mouse mammary tumor virus; HIV-1, human immunodeficiency virus-1. La barra della scala rappresenta il numero di sostituzioni per sito.

Le mappe di omologia cromosomica dei mammiferi mostrano una disposizione patchwork di circa 35 grandi blocchi conservati di sintenia in media (ma circa 80 nel cane e 200 nel topo) e numerosi piccoli blocchi assemblati in diverse combinazioni tra le varie specie e che coprono oltre 90 milioni di anni di evoluzione7. Abbiamo costruito la mappa genetica meiotica più estesa per qualsiasi vertebrato ancora pubblicato, che ha permesso l’ordinamento di X. maculatus scaffold e precisa analisi conservato synteny confrontando genomi di pesce (Nota supplementare). Abbiamo usato l’innovativo approccio RAD (restriction site-associated DNA)-tag8 per costruire una mappa meiotica composta da 16.245 marcatori polimorfici che definiscono 24 gruppi di collegamento equivalente al numero di cromosomi aploidi dell’ornitorinco9. Così, il 90,17% delle sequenze totali in contigs potrebbe essere assegnato una posizione cromosomica. Confronti a lungo raggio dell’ordine dei geni tra le specie10 hanno identificato nuove relazioni evolutive tra i pesci orata e altri cromosomi di teleostei. Medaka, il parente più vicino con un genoma sequenziato, ha anche 24 cromosomi, e 19 di questi hanno mostrato una stretta relazione uno-a-uno con i cromosomi orata (Fig. 3a,b). I rimanenti cinque cromosomi di ornitorinco erano anch’essi ortologhi di un singolo cromosoma di medaka, con l’eccezione di uno o due brevi segmenti (∼1 Mb di lunghezza) che si trovavano su un altro cromosoma di medaka (Fig. 3c e Fig. 4 supplementare). Così, un bel po’ di traslocazioni, tutte molto brevi, hanno interrotto i cariotipi dalla divergenza del medaka e degli ornitorinchi 120 milioni di anni fa11,12. Un quadro simile è emerso dal confronto dei cromosomi degli ornitorinchi con quelli dello spinarello (divergenza 180 milioni di anni fa)11,12. Questi risultati dettagliano l’ampia misura precedentemente sconosciuta in cui il contenuto genetico dei cromosomi in questi teleostei è stato conservato in quasi 200 milioni di anni di evoluzione, una conservazione molto maggiore di quella trovata nei mammiferi in circa la metà di quel tempo7,11,12. Questo è un po’ inaspettato, dato l’evento di duplicazione del genoma dei teleostei (TGD), perché si sarebbe potuto pensare che l’accoppiamento illegittimo di cromosomi paraloghi (derivante dal TGD) avrebbe potuto facilitare le traslocazioni. I meccanismi che possono aver mitigato tali traslocazioni rimangono sconosciuti.

Figura 3: Sintenie conservate tra ornitorinco e medaka.
figure3

(a) Gli ortologhi del medaka dei geni sul cromosoma 9 di X. maculatus cromosoma 9 (Xma9) tendono a trovarsi sul cromosoma 4 di Oryzias latipes (Ola4), mostrando che il contenuto genico di questi cromosomi è rimasto intatto senza traslocazioni nei 120 milioni di anni da quando i lignaggi di queste specie divergono. Ogni punto grigio lungo l’asse orizzontale etichettato Xma9 rappresenta la posizione di un gene platyfish cui medaka ortologa (come giudicato da reciproco best-BLAST analisi hit) si trova direttamente verticale al gene Xma9, tracciato sul cromosoma appropriato medaka10. (b) Reciprocamente, quasi tutti gli ortolani dei geni sul cromosoma Ola4 del medaka si trovano su Xma9. (c) Quasi tutti gli ortolani del medaka di Xma19 si trovano su Ola22, ad eccezione di un segmento lungo circa 1 Mb in posizione 20 Mb su Ola22 che appare su Ola24 (casella tratteggiata).

L’ornitorinco è un modello ben noto nella ricerca sul cancro13. Il suo genoma contiene una regione di controllo del tumore (TCR), compreso l’oncogene xmrk14 che innesca lo sviluppo del melanoma. Il TCR contiene anche il modificatore tumorale mdl15,16. Le varianti alleliche mdl controllano il comparto corporeo, il tempo di insorgenza e la gravità dei tumori17. Inoltre, gli alleli mdl si manifestano nei pesci orata come un’alta diversità di modelli di pigmento geneticamente definiti. Il genoma mappato ci ha permesso di escludere molti geni del pigmento come fattori responsabili di queste varianti di pigmento associate al sesso e modificatori del melanoma. Tutti i geni noti del pigmento18 erano presenti nel genoma dell’ornitorinco femmina XX; quindi, nessuno è specifico del cromosoma Y. Solo 6 dei 174 geni noti del pigmento (asip2a, egfrb, muted, myca, rps20 e tfap2a) erano situati sul cromosoma X (Xma21). Di questi sei, solo il proto-oncogene egfrb risiedeva abbastanza vicino all’oncogene del melanoma xmrk (tabella 4 supplementare) da essere considerato un gene candidato per mdl. Infatti, studi biochimici hanno dimostrato che Egfrb può cooperare con Xmrk19, ma i livelli di espressione di questi geni sono regolati inversamente nel melanoma20. Ulteriori studi sono necessari per valutare la funzione di Egfrb e per trovare altri candidati geni della pigmentazione non classica in questa regione genomica che possono controllare sia il modello di pigmento che il fenotipo del melanoma.

Un altro componente genetico finora non identificato del modello di melanoma dello Xiphophorus è il gene R/Diff. R/Diff sopprime la formazione del melanoma negli ornitorinchi selvatici, e l’eliminazione della sua espressione tramite ibridazione interspecie permette la crescita del tumore. R/Diff è stato mappato in un intervallo di 10-cM su Xma5 vicino al locus cdkn2a/b21. Nonostante il gene CDKN2A umano sia un gene soppressore tumorale ben descritto in alcuni melanomi umani22, cdkn2a/b è stato escluso dall’essere R/Diff perché non è mutato ma è invece sovraespresso nel modello di melanoma Xiphophorus23. La sequenza Xma5 definisce ora un certo numero di geni candidati R/Diff per ulteriori esplorazioni. Per esempio, lo scaffold 182 (1.085.500 bp), che ospita cdkn2a/b, contiene diversi geni con un alto potenziale di avere un ruolo di soppressore del tumore R/Diff (per esempio, tet2, cxxc4, mtap, topo-rs, mdx4 e pdcd4a). In alternativa, la regione può rappresentare un locus complesso che comprende diversi geni che agiscono in modo sinergico o compensatorio per regolare l’oncogene xmrk, coerentemente con i precedenti rapporti di carcinogenesi spontanea e indotta nei molti modelli di tumore ibrido interspecie Xiphophorus24,25,26.

Viviparity è una modalità riproduttiva elaborata che coinvolge diversi livelli di investimento materno nella prole, che vanno dalla fornitura di uova completamente prima della fecondazione e conservando loro attraverso lo sviluppo a minimamente fornire le uova prima della fecondazione e fornendo loro dopo la fecondazione attraverso una placenta, come nei mammiferi. La famiglia dei pesci Poeciliidae, un clade monofiletico di più di 260 specie27, è inusuale in quanto include specie che coprono lo spettro da un apporto trascurabile a uno esteso dopo la fecondazione28,29. Il genoma dell’ornitorinco è il primo di un vertebrato viviparo non-mammifero. Abbiamo eseguito l’analisi in pesci ornitorinco così come in un secondo pesce vivipari, il Xiphophorus hellerii spada, entrambi i quali hanno ben provisioning uova prima della fecondazione30,31, di 3 gruppi di geni viviparity (tuorlo, placenta e geni cappotto uovo; n = 34) per la perdita del gene e selezione positiva rispetto a 4 specie di teleostei deposizione delle uova (medaka, tetraodon, spinarello e pesce zebra).

Nei mammiferi, l’aumento della viviparità è stato proposto per coinvolgere la perdita progressiva di vitellogenine (precursori del tuorlo)32. In pesce ornitorinco e coda di rospo, tutti i geni relativi al tuorlo (vitellogenine e loro trasportatori/recettori; Tabella supplementare 5) erano presenti e si è evoluto sotto selezione purificante, coerente con entrambe le specie completamente provisioning uova prima della fecondazione, con l’eccezione di un gene che si è evoluto sotto selezione positiva, vitellogenin1 (Supplementary Fig. 5a).

Tre dei 13 geni platyfish, i cui ortologhi mammiferi sono legati allo sviluppo della placenta, si è evoluto sotto selezione positiva (Fig. 4a, Supplementary Fig. 5b-d e Supplementary Table 5). Igf2, che nel topo regola la permeabilità della placenta33, si è evoluto sotto forte selezione positiva in ornitorinco (Fig. 4a), che ha particolarmente colpito la regione distale al sito di proteolisi. La sequenza igf233 era disponibile anche da un altro poeciliide, il topminnow del deserto Poeciliopsis lucida, che condivide un antenato livebearing con specie Xiphophorus ma differisce in aver evoluto placentazione recentemente. Nel topminnow del deserto, la stessa regione come in platyfish evoluto sotto selezione positiva, ma la selezione era ancora più forte (Supplementary Fig. 5b), suggerendo in corso l’evoluzione adattativa molecolare in quanto i due generi contenenti questi pesci divergevano diversi milioni di anni fa. Gli altri due geni placentari, pparg e ncoa6, avevano più regioni con segnali di selezione positiva al di fuori dei domini funzionali noti, suggerendo nuove regioni importanti per la viviparità. Gli stessi geni sotto selezione nei pesci vivipari, tuttavia, non hanno mostrato firme di selezione positiva quando sono stati analizzati i geni omologhi dell’ornitorinco che depone le uova e dei marsupiali e dei mammiferi placentari (Tabella 6 supplementare). Questo risultato è in linea con il fatto che le placente dei mammiferi e dei pesci sono strutture convergenti ma non omologhe.

Figura 4: Probabilità posteriori per le classi di siti sotto modelli alternativi lungo il gene per ogni sito aminoacidico calcolato dall’analisi empirica di Bayes.
figure4

I siti di classe 1 sono sotto selezione purificante (rapporto Ka/Ks di ∼0), i siti di classe 2 sono sotto selezione neutra (rapporto Ka/Ks di ∼1), e i siti di classe 3 sono sotto selezione positiva nelle specie Xiphophorus. (a) Insulin-like growth factor 2 (IGF2). Le barre colorate sotto il grafico mostrano i domini funzionali noti, e la freccia mostra il sito di proteolisi (tra i residui 118 e 119). (b) CoriogeninaH minore. In alto, confronto tra i pesci che depongono le uova e quelli vivi. In basso, confronto tra mammiferi placentari e non placentari. Le stesse regioni sono sotto selezione positiva nei pesci e nei mammiferi.

I geni della Zona pellucida (Zpc), che producono un rivestimento ricco di glicoproteine che circonda la membrana plasmatica dell’ovocita, hanno mostrato i cambiamenti più marcati. Al contrario, la coriogeninaH minore, la coriolisinaL, la coriolisinaH e la zvep si sono evolute sotto selezione positiva (Fig. 4b, Fig. 5e-g supplementare e Tabella 5 supplementare). In Xenopus laevis, i geni Zpc controllano il legame specie-specifico dello sperma e aiutano a garantire che solo lo sperma conspecifico rilasciato nell’ambiente acquoso fertilizza le uova34. Pesci vivipari, tuttavia, hanno fecondazione interna, dove specie-specifico riconoscimento sperma non sarebbe così cruciale. Rispetto ai pesci che depongono le uova, il guscio delle uova in questi pesci dovrebbe essersi adattato allo sviluppo all’interno della madre, in quanto non è più essenziale per la protezione ma deve facilitare lo scambio di gas e materiale. I geni degli enzimi di schiusa zvep e choriolysinH hanno mostrato siti di rapida evoluzione generalmente situati adiacenti ai domini catalitici (Fig. 4f,g supplementare), indicando che, durante l’evoluzione della viviparità, questi enzimi potrebbero aver alterato le interazioni con proteine bersaglio o di regolazione. In particolare, nella coriogeninaH minore, le stesse regioni, in particolare nel dominio della zona pellucida, si sono evolute sotto selezione positiva sia nei mammiferi che nei pesci (Fig. 4b). Questo è un esempio evidente di come l’evoluzione convergente a livello molecolare si manifesta a livello fisiologico e infine morfologico.

Le nostre analisi delle conseguenze della TGD hanno scoperto una classe funzionale di geni che ha suscitato il nostro interesse perché i pesci Xiphophorus in particolare e i teleostei in generale mostrano un pronunciato alto livello di complessità comportamentale35 che altri gruppi di vertebrati ‘a sangue freddo’ come gli anfibi e i rettili non raggiungono. Usando il genoma dell’ornitorinco e le annotazioni dei geni di altri sei teleostei sequenziati, ci siamo chiesti se la ritenzione dei geni duplicati dall’evento TGD potesse produrre attraverso la subfunzionalizzazione (ritenzione differenziale di sottofunzioni ancestrali) e/o la neofunzionalizzazione (acquisizione di nuove sottofunzioni)36 l’acquisizione di comportamenti più complessi. Abbiamo confrontato 190 geni legati alla cognizione (Tabella supplementare 7 e Nota supplementare) con quelli coinvolti nella pigmentazione (133 geni, per i quali repertori genici aumentati sono stati collegati all’elevata complessità e diversità della colorazione dei teleostei) e funzioni epatiche (187 geni)18 come controlli. L’analisi dei geni legati alla cognizione ha mostrato un alto tasso di ritenzione dei duplicati del 45% nei pesci orata e valori simili in altri teleostei (Fig. 5 e Fig. 6 supplementare) rispetto ai tassi visti per i geni legati alla pigmentazione (30%) e funzione epatica (15%). Il tasso medio di ritenzione dei duplicati su tutti i geni nei genomi dei teleostei è stimato al 12-24% (rif. 37). Non abbiamo trovato alcun bias nei geni di tutte e tre le categorie funzionali (cognizione, pigmentazione e funzione epatica) che sono stati mantenuti dopo TGD a causa della sensibilità al dosaggio o appartenenza complesso proteico (tabelle supplementari 8 e 9 e nota supplementare), ma un bias nei geni cognizione (ma non funzione epatica e geni pigmentazione) per le proteine particolarmente grandi (> 1.000 aminoacidi di lunghezza) è stato trovato (Supplementary Fig. 7, tabella supplementare 10 e nota supplementare). Tracciare le perdite di geni sull’albero filogenetico ha mostrato che il mantenimento dei geni della cognizione era già fissato poco dopo la TGD e prima della diversificazione dei teleostei. Questo risultato supporta l’ipotesi che la ritenzione di paraloghi dall’evento TGD può aver sostenuto l’alto livello di complessità comportamentale in Xiphophorus e altri teleostei.

Figura 5: Ritenzione differenziale di duplicati genici nella cognizione, pigmentazione e classi funzionali del fegato nei teleostei dopo TGD.
figure5

(a) Tassi di ritenzione per i duplicati derivati dalla TGD di geni legati alla cognizione, alla pigmentazione e alla funzione epatica in sette genomi di teleostei. I punti temporali durante l’evoluzione dei teleostei che coinvolgono il lignaggio che porta a Xiphophorus sono collegati da linee. (b) Mappatura filogenetica delle perdite di geni per 190 coppie di duplicati di geni legati alla cognizione dopo TGD. Le perdite sono indicate con valori negativi. Il numero di coppie di paraloghi TGD conservati per ogni singolo genoma teleosteo è dato tra parentesi. Perdite paraloghi TGD sono stati mappati sulla filogenesi teleosteo fornito da Setiamarga et al.39 seguendo il principio di parsimonia. L’evento TGD è stato impostato a 350 milioni di anni fa. Il tasso di ritenzione dei paraloghi TGD è definito dal numero di coppie di duplicati derivati da TGD presenti in una specifica stirpe diviso per il numero di coppie di duplicati derivati da TGD presenti al momento di TGD18.

La sequenza e l’analisi del genoma dell’ornitorinco hanno fornito nuove prospettive per diverse caratteristiche importanti di questo modello di pesce, tra cui la sua modalità riproduttiva vivente, la variazione dei modelli di pigmentazione, l’evoluzione del cromosoma sessuale in azione, il comportamento complesso e la carcinogenesi sia spontanea che indotta17. I teleostei dominano la fauna ittica esistente e, all’interno dei teleostei (Fig. 1b), la famiglia Poeciliidae, che comprende pesci orata, portaspada, guppy e molly, è un paradigma di questo ampio spettro di adattamenti. Il nostro studio di questo primo genoma di un pesce poeciliide illumina alcuni adattamenti evolutivi dei teleostei e fornisce una risorsa importante per avanzare lo studio del melanoma e di altri fenotipi segreganti.