Articles

Genomul peștelui platyfish, Xiphophorus maculatus, oferă informații despre adaptarea evolutivă și despre mai multe trăsături complexe

Am secvențiat întregul genom al unei singure femele de platyfish (XX, 2n = 46 cromozomi, tulpina Jp163A; Fig. 1) din generația 104 de împerecheri continue frate-soră. Acoperirea totală a secvenței de 19,6 ori (Notă suplimentară) a produs un ansamblu cu lungimi N50 de contig și supercontig de 22 kb și 1,1 Mb, respectiv (Tabelul suplimentar 1). Erorile de asamblare, în principal inserții sau eliminări de un singur nucleotid, au fost corectate cu lecturi Illumina de tip paired-end. Un total de 669 Mb din lungimea estimată a genomului de 750-950 Mb a fost asamblat în contigs. Predicțiile genetice au identificat 20.366 de gene codificatoare, 348 de gene necodificatoare și 28 de pseudogene (Notă suplimentară).

Figura 1: Peștele platyfish, X. maculatus.
figure1

(a) Pește platyfish femelă (sus) și mascul (jos), din tulpina Jp163A cu pete pigmentare negre pe înotătoarea dorsală care se dezvoltă atunci când activitatea unei oncogene cromozomiale X este controlată în mod corespunzător. În cazul genotipurilor hibride, acest control este compromis, iar melanomul malign se dezvoltă din pete. (b) Poziția filogenetică a peștelui platou în raport cu alte specii de pești.

Ca și în cazul altor teleoste, elementele transpozabile (TE) la peștele platou au fost foarte diverse, incluzând multe familii absente la mamifere1 și păsări (figurile suplimentare 1-3, tabelele suplimentare 2 și 3 și nota suplimentară). Am constatat că 4,8% din transcriptom a fost derivat din secvențe TE reprezentând aproximativ 40 de familii diferite, ceea ce indică faptul că mulți dintre TE din peștele platy sunt, cel mai probabil, încă activi. Cei mai activi TE au fost transpozonii ADN Tc1 (>16.000 de copii), urmați de familia RTE (>9.000 de copii). În mod special, am identificat mai multe copii aproape intacte care codifică învelișul unui retrovirus spumos (Spumaviridae) integrat în genomul peștelui platou (Fig. 2). Virușii spumoși sunt cunoscuți ca agenți infecțioși exogeni la mamifere2. Doar recent au fost descrise secvențe endogene de virus spumos care pot fi utilizate pentru a reprezenta o înregistrare fosilă a infecțiilor în genomul leneșului3 și al aye-aye4 la mamifere și în celacant5. O secvență asemănătoare virusului foamy la peștele zebră6, o secvență la cod descoperită în timpul acestei lucrări și secvența genomului peștelui platou raportată aici arată un spectru și mai larg de gazde. Filogenia moleculară a virusurilor foamy este în concordanță cu filogenia gazdei (Fig. 2). Acest rezultat susține ideea unei origini evolutive marine vechi a acestui tip de virus, cu o posibilă coevoluție gazdă-virus5. Copiile aproape intacte ale virusului foamy găsite în genomurile unor specii divergente de pești, absente din alte genomuri de pești secvențiate, ar putea indica introduceri germinale independente prin infectare. Virusul foamy exogen nu fusese descris la pești; cu toate acestea, rezultatele noastre sugerează că virușii foamy exogeni au fost și ar putea fi încă infecțioși în neamul peștilor.

Figura 2: Arbore filogenetic al retrovirusurilor endogene pe baza secvențelor proteinei transcriptazei inverse.
figure2

Secvențele virusului Froamy (FV) (umbră albastru deschis) formează două grupuri filogenetice distincte, unul specific tetrapodelor și unul specific teleostelor. Ambele grupuri conțin secvențe endogene ale virusului spumei (EFV) (secvențele de platyfish și de cod identificate cu puțin timp în urmă sunt evidențiate prin umbrire albastru-închis). Alinierea a fost realizată cu ClustalW (223 de aminoacizi), iar arborele filogenetic a fost construit cu pachetul PhyML folosind metode de maximă verosimilitate38 cu bootstrap implicit (indicat la începutul ramurilor) și opțiuni de calcul optimizate. FV, foamy virus; MuERV-L, Mus musculus endogenous retrovirus-L; BAEV, baboon endogenous virus; FENV1, feline endogenous virus 1; EFV, endogenous foamy virus, MLV, murine leukemia virus; HERV-K, human endogenous retrovirus-K; MMTV, virusul tumorii mamare de șoarece; HIV-1, virusul imunodeficienței umane-1. Bara de scară reprezintă numărul de substituții per situs.

Hărțile de homologie a cromozomilor de mamifere arată un aranjament de tip mozaic de aproximativ 35 de blocuri mari de sintenie conservate în medie (dar aproximativ 80 la câine și 200 la șoarece) și numeroase blocuri mici asamblate în diferite combinații în rândul speciilor variate și care acoperă peste 90 de milioane de ani de evoluție7. Am construit cea mai extinsă hartă genetică meiotică pentru orice vertebrat publicată până în prezent, care a permis ordonarea scheletelor X. maculatus și o analiză precisă a sinteniei conservate comparând genomurile de pești (Notă suplimentară). Am utilizat abordarea inovatoare a ADN-ului asociat situsului de restricție (RAD)-tag8 pentru a construi o hartă meiotică formată din 16 245 de markeri polimorfici care definesc 24 de grupuri de legătură echivalente cu numărul de cromozomi haploizi ai peștelui platou9. Astfel, 90,17% din totalul secvențelor din contigi au putut fi atribuite unei poziții cromozomiale. Comparațiile pe termen lung ale ordinii genelor între specii10 au identificat noi relații evolutive între cromozomii peștelui platou și ai altor teleoste. Medaka, cea mai apropiată rudă cu un genom secvențiat, are, de asemenea, 24 de cromozomi, iar 19 dintre aceștia au prezentat o relație strictă de unu la unu cu cromozomii peștilor platyfish (Fig. 3a,b). Restul de cinci cromozomi ai peștelui platyfish au fost, de asemenea, fiecare ortolog cu un singur cromozom medaka, cu excepția unuia sau a două segmente scurte (∼1 Mb în lungime) care au fost localizate pe un alt cromozom medaka (Fig. 3c și Fig. Suplimentară 4). Astfel, un număr destul de mare de translocații, toate foarte scurte, au perturbat cariotipurile de la divergența medaka și a peștilor plătică în urmă cu 120 de milioane de ani11,12. O imagine similară a reieșit din compararea cromozomilor peștilor platy cu cei ai peștilor stickleback (divergență acum 180 de milioane de ani)11,12. Aceste constatări detaliază amploarea largă, necunoscută până acum, a conservării conținutului genetic al cromozomilor la aceste teleoste pe parcursul a aproape 200 de milioane de ani de evoluție, o conservare mult mai mare decât cea constatată la mamifere pe parcursul a aproximativ jumătate din această perioadă7,11,12. Acest lucru este oarecum neașteptat, având în vedere evenimentul de duplicare a genomului teleostelor (TGD), deoarece s-ar fi putut crede că împerecherea nelegitimă a cromozomilor paralogi (care rezultă din TGD) ar fi putut facilita translocațiile. Mecanismele care ar fi putut atenua astfel de translocații rămân necunoscute.

Figura 3: Sintenii conservate între peștele platy și medaka.
figure3

(a) Ortologii medaka ai genelor de pe X. maculatus pe cromozomul 9 (Xma9) tind să se afle pe cromozomul 4 al Oryzias latipes (Ola4), ceea ce arată că conținutul genic al acestor cromozomi a rămas intact, fără translocații în cei 120 de milioane de ani de când liniile genetice ale acestor specii au deviat. Fiecare punct gri de-a lungul axei orizontale etichetat Xma9 reprezintă poziția unei gene de pești platyfish al cărei ortolog medaka (conform analizei reciproce best-BLAST) se află direct vertical față de gena Xma9, reprezentată pe cromozomul medaka corespunzător10. (b) În mod reciproc, aproape toți ortologii peștilor platyfish ai genelor de pe cromozomul Ola4 al medaka se află pe Xma9. (c) Aproape toate ortologii medaka ai genei Xma19 se află pe Ola22, cu excepția unui segment de aproximativ 1 Mb de lungime la poziția 20 Mb pe Ola22 care apare pe Ola24 (caseta punctată).

Pestele platou este un model bine cunoscut în cercetarea cancerului13. Genomul său conține o regiune de control al tumorii (TCR), inclusiv oncogenele xmrk14 care declanșează dezvoltarea melanomului. TCR conține, de asemenea, modificatorul tumoral mdl15,16. Variantele alelice mdl controlează compartimentul corporal, timpul de apariție și severitatea tumorilor17. În plus, alelele mdl se manifestă la peștele platan ca o mare diversitate de modele pigmentare definite genetic. Genomul cartografiat ne-a permis să excludem multe gene pigmentare ca factori responsabili pentru aceste variante pigmentare asociate sexului și modificatori de melanom. Toate genele de pigmenți cunoscute18 au fost prezente în genomul femelei platyfish XX; prin urmare, niciuna nu este specifică cromozomului Y. Doar 6 din cele 174 de gene pigmentare cunoscute (asip2a, egfrb, muted, myca, rps20 și tfap2a) au fost localizate pe cromozomul X (Xma21). Dintre aceste șase, doar proto-oncogenul egfrb a rezidat suficient de aproape de oncogenele de melanom xmrk (tabelul suplimentar 4) pentru a fi considerată o genă candidată pentru mdl. Într-adevăr, studiile biochimice au arătat că egfrb poate coopera cu Xmrk19, dar nivelurile de expresie ale acestor gene sunt invers reglementate în melanom20. Sunt necesare studii suplimentare pentru a evalua funcția egfrb și pentru a găsi alte gene candidate de pigmentare non-clasică în această regiune genomică, care pot controla atât modelul de pigmentare, cât și fenotipul melanomului.

O altă componentă genetică neidentificată până în prezent a modelului de melanom Xiphophorus este gena R/Diff. R/Diff suprimă formarea melanomului la peștele platyfish sălbatic, iar eliminarea expresiei sale prin hibridare interspecii permite creșterea tumorii. R/Diff a fost cartografiată într-un interval de 10 cm pe Xma5, în apropierea locusului cdkn2a/b21. În ciuda faptului că gena umană ortologă CDKN2A este o genă supresoare tumorală bine descrisă în anumite melanoame umane22, cdkn2a/b a fost exclusă de la R/Diff, deoarece nu este mutantă, ci, în schimb, este supraexprimată în modelul de melanom Xiphophorus23. Secvența Xma5 definește acum o serie de gene candidate R/Diff care trebuie explorate în continuare. De exemplu, schela 182 (1.085.500 pb), care găzduiește cdkn2a/b, conține mai multe gene cu potențial ridicat de a avea un rol de supresor tumoral R/Diff (de exemplu, tet2, cxxc4, mtap, topo-rs, topo-rs, mdx4 și pdcd4a). Alternativ, regiunea poate reprezenta un locus complex care cuprinde mai multe gene care acționează într-o manieră sinergică sau compensatorie pentru a regla oncogena xmrk, în concordanță cu rapoartele anterioare de carcinogeneză spontană și indusă în numeroasele modele tumorale hibride interspecii Xiphophorus24,25,26.

Viviparitatea este un mod de reproducere elaborat care implică diverse niveluri de investiție maternă în urmași, variind de la aprovizionarea completă a ouălor înainte de fertilizare și păstrarea acestora pe tot parcursul dezvoltării până la aprovizionarea minimă a ouălor înainte de fertilizare și aprovizionarea acestora după fertilizare prin intermediul unei placente, ca la mamifere. Familia de pești Poeciliidae, o cladă monofilitică de peste 260 de specii27, este neobișnuită prin faptul că include specii care acoperă spectrul de la un nivel neglijabil până la un nivel extins de aprovizionare după fertilizare28,29. Genomul peștelui platy este primul de la o vertebrată vivipară nemamiferă. Am efectuat o analiză la peștele platyfish, precum și la un al doilea pește vivipare, coada-spadă Xiphophorus hellerii, ambii având ouăle bine aprovizionate înainte de fertilizare30,31, a 3 grupuri de gene ale viviparității (gene ale gălbenușului, ale placentei și ale învelișului ouălor; n = 34) în ceea ce privește pierderea de gene și selecția pozitivă, în comparație cu 4 specii de teleoameni care depun ouă (medaka, tetraodon, stickleback și pește zebră).

La mamifere, s-a propus ca apariția viviparității să implice pierderea progresivă a vitellogeninelor (precursori ai gălbenușului)32. La peștele platou și la coada-spatei, toate genele legate de gălbenuș (vitellogenine și transportatorii/receptorii acestora; tabelul suplimentar 5) au fost prezente și au evoluat sub selecție purificatoare, în concordanță cu faptul că ambele specii au aprovizionat complet ouăle înainte de fertilizare, cu excepția unei gene care a evoluat sub selecție pozitivă, vitellogenin1 (Fig. suplimentară. 5a).

Trei dintre cele 13 gene ale peștelui plătică, ale căror ortologi la mamifere sunt legate de dezvoltarea placentei, au evoluat sub selecție pozitivă (Fig. 4a, Fig. suplimentară 5b-d și Tabelul suplimentar 5). Igf2, care la șoarece reglează permeabilitatea placentei33 , a evoluat sub o selecție pozitivă puternică la peștele platină (Fig. 4a), care a afectat în special regiunea distală față de situsul de proteoliză. Secvența igf233 a fost, de asemenea, disponibilă de la o altă poeciliidă, Poeciliopsis lucida, care împarte un strămoș cu speciile de Xiphophorus, dar care diferă prin faptul că a evoluat recent în ceea ce privește placentarea. La topminnow din deșert, aceeași regiune ca și la peștele-platan a evoluat sub selecție pozitivă, dar selecția a fost chiar mai puternică (Fig. suplimentară 5b), sugerând o evoluție adaptivă moleculară în curs de desfășurare de când cele două genuri care conțin acești pești au deviat cu câteva milioane de ani în urmă. Celelalte două gene placentare, pparg și ncoa6, au avut mai multe regiuni cu semnale de selecție pozitivă în afara domeniilor funcționale cunoscute, sugerând regiuni noi importante pentru viviparitate. Aceleași gene supuse selecției la peștii vivanți, cu toate acestea, nu au prezentat semnături de selecție pozitivă atunci când au fost analizate genele ortologe de la ornitorincul ouător și de la mamiferele marsupiale și placentare (tabelul suplimentar 6). Acest rezultat este în concordanță cu faptul că placentele mamiferelor și ale peștilor sunt structuri convergente, dar nu omoloage.

Figura 4: Probabilități posterioare pentru clasele de situsuri în cadrul modelelor alternative de-a lungul genei pentru fiecare situs de aminoacizi, calculate prin analiza Bayes empirică Bayes.
figure4

Situațiile din clasa 1 sunt supuse unei selecții purificatoare (raport Ka/Ks de ∼0), cele din clasa 2 sunt supuse unei selecții neutre (raport Ka/Ks de ∼1), iar cele din clasa 3 sunt supuse unei selecții pozitive la speciile Xiphophorus. (a) Factorul de creștere asemănător insulinei 2 (IGF2). Barele colorate de sub grafic arată domeniile funcționale cunoscute, iar săgeata arată situsul de proteoliză (între reziduurile 118 și 119). (b) ChoriogeninH minor. Sus, comparație între peștii care depun ouă și cei care trăiesc. Jos, comparație între mamiferele placentare și cele neplacentare. Aceleași regiuni sunt supuse selecției pozitive la pești și mamifere.

Genele Zona pellucida (Zpc), care produc un înveliș bogat în glicoproteine care înconjoară membrana plasmatică a ovocitelor, au prezentat cele mai pronunțate modificări. alveolina a fost pierdută din genomul peștelui platou. În schimb, choriogeninH minor, choriolysinL, choriolysinH și zvep au evoluat sub selecție pozitivă (Fig. 4b, Fig. suplimentară 5e-g și Tabelul suplimentar 5). La Xenopus laevis, genele Zpc controlează legarea spermatozoizilor specifică speciei și contribuie la asigurarea faptului că numai spermatozoizii conspecifici eliberați în mediul apos fertilizează ouăle34. Cu toate acestea, peștii vivipari au o fertilizare internă, unde recunoașterea spermatozoizilor specifică speciei nu ar fi la fel de crucială. În comparație cu peștii care depun ouă, se așteaptă ca la acești pești coaja ouălor să se fi adaptat la dezvoltarea în interiorul mamei, deoarece nu mai este esențială pentru protecție, ci trebuie să faciliteze schimbul de gaze și materiale. Genele enzimelor de eclozare zvep și choriolysinH au prezentat situsuri cu evoluție rapidă situate, în general, în apropierea domeniilor catalitice (Fig. suplimentară 4f,g), ceea ce indică faptul că, în timpul evoluției viviparității, aceste enzime ar fi putut modifica interacțiunile cu proteinele țintă sau de reglementare. În mod notabil, în choriogeninH minor, aceleași regiuni, în special în domeniul zonei pellucida, au evoluat sub selecție pozitivă atât la mamifere, cât și la pești (Fig. 4b). Acesta este un exemplu notabil al modului în care evoluția convergentă la nivel molecular se manifestă la nivel fiziologic și, în cele din urmă, morfologic.

Analizele noastre privind consecințele TGD au descoperit o clasă funcțională de gene care ne-a stârnit interesul deoarece peștii Xiphophorus, în special, și teleostelele, în general, prezintă un nivel ridicat pronunțat de complexitate comportamentală35 pe care alte grupuri de vertebrate cu „sânge rece”, cum ar fi amfibienii și reptilele, nu îl ating. Utilizând genomul peștelui platy și adnotările genelor de la alte șase teleoste secvențiate, ne-am întrebat dacă retenția genelor duplicate de la evenimentul TGD ar putea produce prin subfuncționalizare (retenția diferențială a subfuncțiilor ancestrale) și/sau neofuncționalizare (achiziția de noi subfuncții)36 dobândirea unor comportamente mai complexe. Am comparat 190 de gene legate de cogniție (tabelul suplimentar 7 și nota suplimentară) cu cele implicate în pigmentare (133 de gene, pentru care repertoriile genetice crescute au fost legate de complexitatea și diversitatea ridicată a colorării teleostelor) și funcțiile hepatice (187 de gene)18 ca martori. Analiza genelor legate de cogniție a arătat o rată ridicată de păstrare a duplicatelor, de 45 % la peștele platy și valori similare la alte teleoste (Fig. 5 și Fig. suplimentară 6), în comparație cu ratele observate pentru genele legate de pigmentare (30 %) și funcția hepatică (15 %). Rata medie de retenție a duplicatelor pentru toate genele din genomurile teleostelor este estimată la 12-24% (ref. 37). Nu am constatat nicio prejudecată în genele din toate cele trei categorii funcționale (cogniție, pigmentare și funcție hepatică) care au fost reținute după TGD din cauza sensibilității la dozaj sau a apartenenței la complexul de proteine (tabelele suplimentare 8 și 9 și nota suplimentară), dar s-a constatat o prejudecată în genele de cogniție (dar nu și în genele de funcție hepatică și pigmentare) pentru proteinele deosebit de mari (>1 000 de aminoacizi în lungime) (figura suplimentară 7, tabelul suplimentar 10 și nota suplimentară). Trasarea pierderilor de gene pe arborele filogenetic a arătat că reținerea genelor de cogniție a fost deja fixată la scurt timp după TGD și înainte de diversificarea teleostelor. Această constatare susține ipoteza că reținerea paralogilor de la evenimentul TGD ar fi putut susține nivelul ridicat de complexitate comportamentală la Xiphophorus și la alte teleoste.

Figura 5: Retenția diferențială a duplicatelor de gene în clasele funcționale de cogniție, pigmentare și ficat la teleoste după TGD.
figure5

(a) Ratele de retenție pentru duplicatele derivate din TGD ale genelor legate de cogniție, pigmentare și funcția hepatică în șapte genomuri de teleoste. Punctele temporale din timpul evoluției teleostelor care implică descendența care duce la Xiphophorus sunt conectate prin linii. (b) Cartografierea filogenetică a pierderilor de gene pentru 190 de perechi de duplicate de gene legate de cogniție după TGD. Pierderile sunt indicate cu valori negative. Numărul de perechi de paralogi TGD reținute pentru fiecare genom individual de teleostom este indicat în paranteze. Pierderile de paralogi TGD au fost cartografiate pe filogenia teleostelor furnizată de Setiamarga et al.39 în conformitate cu principiul parsimoniei. Evenimentul TGD a fost stabilit la 350 de milioane de ani în urmă. Rata de retenție a paralogilor TGD este definită prin numărul de perechi de duplicate derivate din TGD prezente într-o anumită linie genealogică împărțit la numărul de perechi de duplicate derivate din TGD prezente la momentul TGD18.

Secvența și analiza genomului peștelui plătică au oferit noi perspective pentru mai multe caracteristici proeminente ale acestui model de pește, inclusiv modul său de reproducere în viață, variația modelelor de pigmentare, evoluția cromozomilor sexuali în acțiune, comportamentul complex și carcinogeneza atât spontană, cât și indusă17. Teleostelele domină fauna piscicolă existentă, iar, în cadrul teleostelor (Fig. 1b), familia Poeciliidae, care include peștii platyfish, swordtails, guppy și molly, este o paradigmă a acestui spectru larg de adaptări. Studiul nostru al acestui prim genom al unui pește poeciliid luminează unele adaptări evolutive ale teleostelor și oferă o resursă importantă pentru a avansa studiul melanomului și al altor fenotipuri segregante.

.