Genom platyfusa, Xiphophorus maculatus, dostarcza wglądu w ewolucyjną adaptację i kilka złożonych cech
Sekwencjonowaliśmy cały genom pojedynczej samicy platyfusa (XX, 2n = 46 chromosomów, szczep Jp163A; ryc. 1) z pokolenia 104 ciągłych kojarzeń brat-siostra. Całkowite pokrycie sekwencji 19,6-krotne (Supplementary Note) dało asemblację o długościach N50 kontigów i supercontigów odpowiednio 22 kb i 1,1 Mb (Supplementary Table 1). Błędy w asocjacji, głównie insercje lub delecje pojedynczych nukleotydów, zostały skorygowane przy użyciu sparowanych odczytów Illumina. W sumie 669 Mb z szacowanej długości genomu 750-950 Mb zostało zmontowane w kontigach. Przewidywania genów zidentyfikowały 20 366 genów kodujących, 348 genów niekodujących i 28 pseudogenów (Supplementary Note).
Jak u innych teleostów, elementy transpozycyjne (TE) u platyfusa były bardzo zróżnicowane, w tym wiele rodzin nieobecnych u ssaków1 i ptaków (Uzupełniające Fig. 1-3, Uzupełniające Tabele 2 i 3 oraz Uzupełniająca Notatka). Stwierdziliśmy, że 4,8% transkryptomu pochodziło z sekwencji TE reprezentujących około 40 różnych rodzin, co wskazuje, że wiele z TE u płaszczek jest najprawdopodobniej nadal aktywnych. Najbardziej aktywnymi TE były transpozony DNA Tc1 (>16,000 kopii), a następnie rodzina RTE (>9,000 kopii). Na uwagę zasługuje fakt, że zidentyfikowaliśmy kilka prawie nienaruszonych kopii kodujących otoczkę retrowirusa piankowatego (Spumaviridae) zintegrowanych z genomem platyfusa (Fig. 2). Wirusy piankowate znane są jako egzogenne czynniki zakaźne u ssaków2. Dopiero niedawno w genomach leniwca3 i aye-aye4 u ssaków oraz u koelakanta5 opisano endogenne sekwencje wirusów piankowatych, które mogą być wykorzystane do reprezentowania kopalnego zapisu infekcji. Sekwencja podobna do wirusa piankowatego u zebrafish6, sekwencja u dorsza odkryta podczas tej pracy oraz sekwencja genomu platyfish opisana w niniejszym opracowaniu wskazują na jeszcze szersze spektrum gospodarzy. Filogeneza molekularna wirusów piankowatych jest zgodna z filogenezą żywicieli (ryc. 2). Wynik ten potwierdza tezę o starożytnym morskim pochodzeniu ewolucyjnym tego typu wirusa, z możliwą koewolucją gospodarz-wirus5. Prawie nienaruszone kopie wirusa foamy znalezione w genomach niektórych rozbieżnych gatunków ryb, nieobecne w innych sekwencjonowanych genomach ryb, mogą wskazywać na niezależne wprowadzenie do linii germinalnej poprzez zakażenie. Egzogenny wirus foamy nie został opisany u ryb; jednakże nasze wyniki sugerują, że egzogenne wirusy foamy były i nadal mogą być zakaźne w linii ryb.
Mapy homologii chromosomów ssaków pokazują mozaikowy układ średnio około 35 dużych, konserwowanych bloków syntenii (ale około 80 u psa i 200 u myszy) i licznych małych bloków montowanych w różnych kombinacjach wśród różnych gatunków i obejmujących ponad 90 milionów lat ewolucji7. Skonstruowaliśmy najbardziej rozległą mejotyczną mapę genetyczną dla jakiegokolwiek kręgowca, jaka została dotychczas opublikowana, co pozwoliło na uporządkowanie rusztowań X. maculatus i precyzyjną analizę konserwatywnej syntenii porównującą genomy ryb (Supplementary Note). Wykorzystaliśmy innowacyjną metodę znakowania DNA związanego z miejscami restrykcyjnymi (RAD)-tag8 do skonstruowania mapy mejotycznej składającej się z 16 245 polimorficznych markerów, które definiują 24 grupy powiązań odpowiadające haploidalnej liczbie chromosomów platyfusa9. W ten sposób 90,17% wszystkich sekwencji w kontigach mogło być przypisanych do pozycji chromosomalnej. Dalekosiężne porównania kolejności genów u różnych gatunków10 pozwoliły na zidentyfikowanie nowych relacji ewolucyjnych pomiędzy chromosomami platyfusa i innych teleostów. Medaka, najbliższy krewny z sekwencjonowanym genomem, również ma 24 chromosomy, a 19 z nich wykazywało ścisłą relację jeden do jednego z chromosomami platyfusa (ryc. 3a,b). Pozostałe pięć chromosomów platyfusa było również ortologicznych do jednego chromosomu medaki, z wyjątkiem jednego lub dwóch krótkich segmentów (∼1 Mb długości), które znajdowały się na innym chromosomie medaki (Rys. 3c i Supplementary Fig. 4). Tak więc całkiem sporo translokacji, wszystkie bardzo krótkie, zaburzyło kariotypy od czasu rozejścia się medaki i platyfidy 120 milionów lat temu11,12. Podobny obraz wyłonił się z porównania chromosomów płaszczki z chromosomami ciernika (dywergencja 180 milionów lat temu)11,12. Odkrycia te ukazują nieznany wcześniej szeroki zakres, w jakim genetyczna zawartość chromosomów u tych teleostów była konserwowana przez prawie 200 milionów lat ewolucji, co stanowi konserwację znacznie większą niż u ssaków przez około połowę tego czasu7,11,12. Jest to nieco nieoczekiwane, biorąc pod uwagę wydarzenie duplikacji genomu teleostów (TGD), ponieważ można by pomyśleć, że nieuprawnione łączenie w pary chromosomów paralogicznych (wynikające z TGD) mogło ułatwić translokacje. Mechanizmy, które mogły złagodzić takie translokacje pozostają nieznane.
Platyfus jest dobrze znanym modelem w badaniach nad nowotworami13. Jego genom zawiera region kontroli nowotworu (TCR), w tym onkogen xmrk14, który wyzwala rozwój czerniaka. TCR zawiera również modyfikator nowotworowy mdl15,16. Warianty alleliczne mdl kontrolują przedział ciała, czas wystąpienia i nasilenie nowotworów17. Ponadto, allele mdl manifestują się u platyfusów jako duża różnorodność genetycznie zdefiniowanych wzorów pigmentu. Zmapowany genom pozwolił nam na wykluczenie wielu genów pigmentu jako czynników odpowiedzialnych za te związane z płcią warianty pigmentu i modyfikatory czerniaka. Wszystkie znane geny pigmentu18 były obecne w genomie XX samic platyfish; tak więc żaden z nich nie jest specyficzny dla chromosomu Y. Tylko 6 ze 174 znanych genów pigmentu (asip2a, egfrb, muted, myca, rps20 i tfap2a) było zlokalizowanych na chromosomie X (Xma21). Spośród tych sześciu, tylko proto-onkogen egfrb znajdował się wystarczająco blisko onkogenu czerniaka xmrk (Tabela uzupełniająca 4), aby uznać go za gen kandydujący dla mdl. Rzeczywiście, badania biochemiczne wykazały, że Egfrb może współpracować z Xmrk19, ale poziomy ekspresji tych genów są odwrotnie regulowane w czerniaku20. Potrzebne są dalsze badania w celu oceny funkcji egfrb i znalezienia innych kandydatów na geny nieklasycznej pigmentacji w tym regionie genomowym, które mogą kontrolować zarówno wzór pigmentu jak i fenotyp czerniaka.
Kolejnym do tej pory niezidentyfikowanym składnikiem genetycznym modelu czerniaka Xiphophorus jest gen R/Diff. R/Diff hamuje powstawanie czerniaka u dzikich platyfusów, a eliminacja jego ekspresji poprzez hybrydyzację międzygatunkową umożliwia wzrost guza. R/Diff został zmapowany do 10-cM interwału na Xma5 w pobliżu locus cdkn2a/b21. Mimo że ortologiczny ludzki gen CDKN2A jest dobrze opisanym genem supresorowym nowotworów w niektórych ludzkich czerniakach22, cdkn2a/b został wykluczony z R/Diff, ponieważ nie jest zmutowany, lecz ulega nadekspresji w modelu czerniaka Xiphophorus23. Sekwencja Xma5 definiuje teraz szereg genów kandydujących do R/Diff do dalszej eksploracji. Na przykład, rusztowanie 182 (1,085,500 bp), które zawiera cdkn2a/b, zawiera kilka genów o wysokim potencjale do pełnienia roli supresora nowotworów R/Diff (na przykład tet2, cxxc4, mtap, topo-rs, mdx4 i pdcd4a). Alternatywnie, region ten może reprezentować złożone locus obejmujące kilka genów, które działają w sposób synergistyczny lub kompensacyjny w celu regulacji onkogenu xmrk, zgodnie z wcześniejszymi doniesieniami o spontanicznej i indukowanej kancerogenezie w wielu modelach hybrydowych guzów Xiphophorus międzygatunkowych24,25,26.
Viviparity jest skomplikowany tryb reprodukcyjny obejmujący różne poziomy matczynych inwestycji w potomstwo, począwszy od pełnego zaopatrzenia jaj przed zapłodnieniem i utrzymanie ich przez rozwój do minimalnie zaopatrzenia jaj przed zapłodnieniem i dostarczanie ich po zapłodnieniu przez łożysko, jak u ssaków. Rodzina ryb Poeciliidae, monofiletyczny klad obejmujący ponad 260 gatunków27, jest niezwykła, ponieważ zawiera gatunki, które obejmują spektrum od znikomego do ekstensywnego odżywiania po zapłodnieniu28,29. Genom platyfusa jest pierwszym genomem pochodzącym od kręgowca żyworodnego nie będącego ssakiem. Przeprowadziliśmy analizę 3 grup genów wiwipolarności (geny żółtka, łożyska i płaszcza jaja; n = 34) pod kątem utraty genów i pozytywnej selekcji w porównaniu z 4 gatunkami jajorodnych teleostów (medaka, tetraodon, ciernik i zebrafish) u platyfona, jak również u drugiej żyworodnej ryby.
W ssakach zaproponowano, że powstanie żyworodności wiąże się z postępującą utratą vitellogenin (prekursorów żółtka)32. U racicznicy i mieczyka wszystkie geny związane z żółtkiem (witellogeniny i ich transportery/receptory; Supplementary Table 5) były obecne i ewoluowały pod wpływem selekcji oczyszczającej, zgodnie z tym, że oba gatunki w pełni zaopatrywały jaja przed zapłodnieniem, z wyjątkiem jednego genu, który ewoluował pod wpływem selekcji pozytywnej, witellogeniny1 (Supplementary Fig. 5a).
Trzy z 13 genów platyfish, których ortologi u ssaków są związane z rozwojem łożyska, ewoluowały pod wpływem pozytywnej selekcji (Fig. 4a, Supplementary Fig. 5b-d i Supplementary Table 5). Igf2, który u myszy reguluje przepuszczalność łożyska33, ewoluował pod wpływem silnej pozytywnej selekcji u platyfusów (ryc. 4a), która szczególnie dotknęła region dystalny do miejsca proteolizy. Sekwencja igf233 była również dostępna u innego poeciliida, topinambura pustynnego Poeciliopsis lucida, który dzieli żyworodnego przodka z gatunkami Xiphophorus, ale różni się tym, że łożysko wyewoluowało niedawno. U topinambura pustynnego ten sam region co u platyfish ewoluował pod wpływem pozytywnej selekcji, ale była ona jeszcze silniejsza (Supplementary Fig. 5b), co sugeruje trwającą molekularną ewolucję adaptacyjną od czasu, gdy dwa rodzaje zawierające te ryby rozdzieliły się kilka milionów lat temu. Dwa inne geny łożyskowe, pparg i ncoa6, miały wiele regionów z sygnałami pozytywnej selekcji poza znanymi domenami funkcjonalnymi, co sugeruje nowe regiony ważne dla wiwipolarności. Te same geny podlegające selekcji u ryb żyworodnych nie wykazywały jednak pozytywnych sygnatur selekcyjnych, gdy analizowano ortologiczne geny pochodzące od składającego jaja platypusa oraz od ssaków marsupialnych i łożyskowych (Tabela 6). Wynik ten jest zgodny z faktem, że łożyska ssaków i ryb są strukturami zbieżnymi, ale nie homologicznymi.
Geny Zona pellucida (Zpc), które wytwarzają bogaty w glikoproteiny płaszcz otaczający błonę plazmatyczną oocytu, wykazały najwyraźniejsze zmiany. alveolin został utracony z genomu platyfusa. Natomiast choriogeninaH minor, choriolizynaL, choriolizynaH i zvep ewoluowały pod wpływem pozytywnej selekcji (ryc. 4b, uzupełniające ryc. 5e-g i uzupełniająca tabela 5). U Xenopus laevis geny Zpc kontroluj± specyficzne dla gatunku wi±zanie plemników i pomagaj± zapewnić, że tylko specyficzne plemniki uwalniane do ¶rodowiska wodnego zapładniaj± jaja34. U ryb żyworodnych dochodzi jednak do zapłodnienia wewnętrznego, gdzie rozpoznawanie specyficznych gatunkowo plemników nie jest tak istotne. W porównaniu z rybami składającymi jaja, można się spodziewać, że skorupa jajowa u tych ryb przystosowała się do rozwoju wewnątrz matki, ponieważ nie jest już niezbędna do ochrony, ale musi ułatwiać wymianę gazową i materiałową. Geny enzymów wylęgowych zvep i choriolizynyH wykazały szybko ewoluujące miejsca, zlokalizowane na ogół w pobliżu domen katalitycznych (Supplementary Fig. 4f,g), co wskazuje, że podczas ewolucji wiwipolarności enzymy te mogły zmienić interakcje z białkami docelowymi lub regulatorowymi. Zauważmy, że w choriogeninieH minor, te same regiony, w szczególności w domenie zona pellucida, ewoluowały pod wpływem pozytywnej selekcji zarówno u ssaków, jak i u ryb (ryc. 4b). Jest to widoczny przykład tego, jak zbieżna ewolucja na poziomie molekularnym przejawia się na poziomie fizjologicznym i ostatecznie morfologicznym.
Nasze analizy konsekwencji TGD odkryły funkcjonalną klasę genów, która wzbudziła nasze zainteresowanie, ponieważ ryby Xiphophorus w szczególności i teleosty w ogóle wykazują wyraźny wysoki poziom złożoności behawioralnej35, którego nie osiągają inne grupy „zimnokrwistych” kręgowców, takich jak płazy i gady. Używając genomu platyfusa i anotacji genów z sześciu innych sekwencjonowanych teleostów, zapytaliśmy, czy duplikacja genów zachowana po zdarzeniu TGD mogła wytworzyć poprzez subfunkcjonalizację (zróżnicowane zachowanie subfunkcji przodków) i/lub neofunkcjonalizację (nabycie nowych subfunkcji)36 nabycie bardziej złożonych zachowań. Porównaliśmy 190 genów związanych z poznaniem (Tabela uzupełniająca 7 i Uwaga uzupełniająca) do tych zaangażowanych w pigmentację (133 geny, dla których zwiększony repertuar genów został powiązany z wysoką złożonością i różnorodnością ubarwienia teleostów) i funkcje wątroby (187 genów)18 jako kontroli. Analiza genów związanych z poznaniem wykazała wysoki wskaźnik retencji duplikatów wynoszący 45% u platyfusów i podobne wartości u innych teleostów (Rys. 5 i Supplementary Fig. 6) w porównaniu do wskaźników zaobserwowanych dla genów związanych z pigmentacją (30%) i funkcją wątroby (15%). Średni wskaźnik retencji duplikatów dla wszystkich genów w genomach teleostów szacowany jest na 12-24% (ref. 37). Nie znaleźliśmy żadnego odchylenia w genach ze wszystkich trzech kategorii funkcjonalnych (poznania, pigmentacji i funkcji wątroby), które zostały zachowane po TGD z powodu wrażliwości na dawkę lub przynależności do kompleksu białkowego (Tabele uzupełniające 8 i 9 oraz Uwaga uzupełniająca), ale stwierdzono odchylenie w genach poznania (ale nie funkcji wątroby i genach pigmentacji) dla szczególnie dużych białek (>1000 aminokwasów długości) (Rys. 7, Tabela uzupełniająca 10 i Uwaga uzupełniająca). Wykreślenie strat genów na drzewie filogenetycznym pokazało, że retencja genów poznania była już ustalona krótko po TGD i przed dywersyfikacją teleostów. To odkrycie wspiera hipotezę, że retencja paralogów z wydarzenia TGD mogła wspierać wysoki poziom złożoności behawioralnej u Xiphophorus i innych teleostów.
Sekwencja genomu i analiza genomu platyfish dostarczyły nowych perspektyw dla kilku wybitnych cech tego modelu ryby, w tym jej trybu rozrodczego, zmienności wzorców pigmentacji, ewolucji chromosomów płciowych w działaniu, złożonego zachowania i zarówno spontanicznej jak i indukowanej kancerogenezy17. Teleosty dominują w istniejącej faunie ryb, a w obrębie teleostów (Rys. 1b) rodzina Poeciliidae, w tym platyfidy, mieczyki, gupiki i molinezje, jest paradygmatem tego szerokiego spektrum adaptacji. Nasze badania tego pierwszego genomu ryb poeciliidalnych oświetlają niektóre ewolucyjne adaptacje teleostów i dostarczają ważnych zasobów do dalszych badań nad czerniakiem i innymi fenotypami segregującymi.
.