Articles

Genom platyfusa, Xiphophorus maculatus, dostarcza wglądu w ewolucyjną adaptację i kilka złożonych cech

Sekwencjonowaliśmy cały genom pojedynczej samicy platyfusa (XX, 2n = 46 chromosomów, szczep Jp163A; ryc. 1) z pokolenia 104 ciągłych kojarzeń brat-siostra. Całkowite pokrycie sekwencji 19,6-krotne (Supplementary Note) dało asemblację o długościach N50 kontigów i supercontigów odpowiednio 22 kb i 1,1 Mb (Supplementary Table 1). Błędy w asocjacji, głównie insercje lub delecje pojedynczych nukleotydów, zostały skorygowane przy użyciu sparowanych odczytów Illumina. W sumie 669 Mb z szacowanej długości genomu 750-950 Mb zostało zmontowane w kontigach. Przewidywania genów zidentyfikowały 20 366 genów kodujących, 348 genów niekodujących i 28 pseudogenów (Supplementary Note).

Ryc. 1: Rycina 1: Ryba platyfus, X. maculatus.
figure1

(a) Samica (u góry) i samiec (na dole) platyfish, szczepu Jp163A z czarnymi plamami pigmentowymi na płetwie grzbietowej, które rozwijają się, gdy aktywność onkogenu chromosomu X jest odpowiednio kontrolowana. U genotypów hybrydowych kontrola ta jest zaburzona, a z plam rozwija się czerniak złośliwy. (b) Pozycja filogenetyczna platyfusa w stosunku do innych gatunków ryb.

Jak u innych teleostów, elementy transpozycyjne (TE) u platyfusa były bardzo zróżnicowane, w tym wiele rodzin nieobecnych u ssaków1 i ptaków (Uzupełniające Fig. 1-3, Uzupełniające Tabele 2 i 3 oraz Uzupełniająca Notatka). Stwierdziliśmy, że 4,8% transkryptomu pochodziło z sekwencji TE reprezentujących około 40 różnych rodzin, co wskazuje, że wiele z TE u płaszczek jest najprawdopodobniej nadal aktywnych. Najbardziej aktywnymi TE były transpozony DNA Tc1 (>16,000 kopii), a następnie rodzina RTE (>9,000 kopii). Na uwagę zasługuje fakt, że zidentyfikowaliśmy kilka prawie nienaruszonych kopii kodujących otoczkę retrowirusa piankowatego (Spumaviridae) zintegrowanych z genomem platyfusa (Fig. 2). Wirusy piankowate znane są jako egzogenne czynniki zakaźne u ssaków2. Dopiero niedawno w genomach leniwca3 i aye-aye4 u ssaków oraz u koelakanta5 opisano endogenne sekwencje wirusów piankowatych, które mogą być wykorzystane do reprezentowania kopalnego zapisu infekcji. Sekwencja podobna do wirusa piankowatego u zebrafish6, sekwencja u dorsza odkryta podczas tej pracy oraz sekwencja genomu platyfish opisana w niniejszym opracowaniu wskazują na jeszcze szersze spektrum gospodarzy. Filogeneza molekularna wirusów piankowatych jest zgodna z filogenezą żywicieli (ryc. 2). Wynik ten potwierdza tezę o starożytnym morskim pochodzeniu ewolucyjnym tego typu wirusa, z możliwą koewolucją gospodarz-wirus5. Prawie nienaruszone kopie wirusa foamy znalezione w genomach niektórych rozbieżnych gatunków ryb, nieobecne w innych sekwencjonowanych genomach ryb, mogą wskazywać na niezależne wprowadzenie do linii germinalnej poprzez zakażenie. Egzogenny wirus foamy nie został opisany u ryb; jednakże nasze wyniki sugerują, że egzogenne wirusy foamy były i nadal mogą być zakaźne w linii ryb.

Rysunek 2: Drzewo filogenetyczne endogennych retrowirusów oparte na sekwencjach białek odwrotnej transkryptazy.
figure2

Sekwencje wirusa Foamy (FV) (jasnoniebieskie cieniowanie) tworzą dwie odrębne grupy filogenetyczne, jedną specyficzną dla tetrapoda i jedną specyficzną dla teleosta. Obie grupy zawierają endogenne sekwencje foamy virus (EFV) (nowo zidentyfikowane sekwencje platyfish i dorsza są zaznaczone ciemnoniebieskim cieniowaniem). Alignment przeprowadzono przy użyciu ClustalW (223 aminokwasy), a drzewo filogenetyczne skonstruowano przy użyciu pakietu PhyML, stosując metody największego prawdopodobieństwa38 z domyślnym bootstrapem (pokazanym na początku gałęzi) i zoptymalizowanymi opcjami obliczeń. FV, foamy virus; MuERV-L, Mus musculus endogenous retrovirus-L; BAEV, baboon endogenous virus; FENV1, feline endogenous virus 1; EFV, endogenous foamy virus, MLV, murine leukemia virus; HERV-K, human endogenous retrovirus-K; MMTV, mouse mammary tumor virus; HIV-1, human immunodeficiency virus-1. Pasek skali przedstawia liczbę substytucji na miejsce.

Mapy homologii chromosomów ssaków pokazują mozaikowy układ średnio około 35 dużych, konserwowanych bloków syntenii (ale około 80 u psa i 200 u myszy) i licznych małych bloków montowanych w różnych kombinacjach wśród różnych gatunków i obejmujących ponad 90 milionów lat ewolucji7. Skonstruowaliśmy najbardziej rozległą mejotyczną mapę genetyczną dla jakiegokolwiek kręgowca, jaka została dotychczas opublikowana, co pozwoliło na uporządkowanie rusztowań X. maculatus i precyzyjną analizę konserwatywnej syntenii porównującą genomy ryb (Supplementary Note). Wykorzystaliśmy innowacyjną metodę znakowania DNA związanego z miejscami restrykcyjnymi (RAD)-tag8 do skonstruowania mapy mejotycznej składającej się z 16 245 polimorficznych markerów, które definiują 24 grupy powiązań odpowiadające haploidalnej liczbie chromosomów platyfusa9. W ten sposób 90,17% wszystkich sekwencji w kontigach mogło być przypisanych do pozycji chromosomalnej. Dalekosiężne porównania kolejności genów u różnych gatunków10 pozwoliły na zidentyfikowanie nowych relacji ewolucyjnych pomiędzy chromosomami platyfusa i innych teleostów. Medaka, najbliższy krewny z sekwencjonowanym genomem, również ma 24 chromosomy, a 19 z nich wykazywało ścisłą relację jeden do jednego z chromosomami platyfusa (ryc. 3a,b). Pozostałe pięć chromosomów platyfusa było również ortologicznych do jednego chromosomu medaki, z wyjątkiem jednego lub dwóch krótkich segmentów (∼1 Mb długości), które znajdowały się na innym chromosomie medaki (Rys. 3c i Supplementary Fig. 4). Tak więc całkiem sporo translokacji, wszystkie bardzo krótkie, zaburzyło kariotypy od czasu rozejścia się medaki i platyfidy 120 milionów lat temu11,12. Podobny obraz wyłonił się z porównania chromosomów płaszczki z chromosomami ciernika (dywergencja 180 milionów lat temu)11,12. Odkrycia te ukazują nieznany wcześniej szeroki zakres, w jakim genetyczna zawartość chromosomów u tych teleostów była konserwowana przez prawie 200 milionów lat ewolucji, co stanowi konserwację znacznie większą niż u ssaków przez około połowę tego czasu7,11,12. Jest to nieco nieoczekiwane, biorąc pod uwagę wydarzenie duplikacji genomu teleostów (TGD), ponieważ można by pomyśleć, że nieuprawnione łączenie w pary chromosomów paralogicznych (wynikające z TGD) mogło ułatwić translokacje. Mechanizmy, które mogły złagodzić takie translokacje pozostają nieznane.

Rysunek 3: Konserwatywne synteny między platyfusem a medaką.
figure3

(a) Ortologi genów medaki na chromosomie 9 X. maculatus na chromosomie 9 (Xma9) mają tendencję do leżenia na chromosomie 4 (Ola4) Oryzias latipes, co pokazuje, że zawartość genowa tych chromosomów pozostała nienaruszona, bez żadnych translokacji w ciągu 120 milionów lat od rozejścia się linii tych gatunków. Każda szara kropka wzdłuż osi poziomej oznaczona jako Xma9 reprezentuje pozycję genu platyfish, którego ortolog u medaki (zgodnie z oceną wzajemnej analizy trafień Best-BLAST) leży bezpośrednio pionowo do genu Xma9, wykreślonego na odpowiednim chromosomie medaki10. (b) I odwrotnie, prawie wszystkie ortologi genów platyfusów na chromosomie Ola4 medaki leżą na Xma9. (c) Prawie wszystkie ortologi medaki dla Xma19 leżą na Ola22, z wyjątkiem segmentu o długości około 1 Mb w pozycji 20 Mb na Ola22, który występuje na Ola24 (przerywana ramka).

Platyfus jest dobrze znanym modelem w badaniach nad nowotworami13. Jego genom zawiera region kontroli nowotworu (TCR), w tym onkogen xmrk14, który wyzwala rozwój czerniaka. TCR zawiera również modyfikator nowotworowy mdl15,16. Warianty alleliczne mdl kontrolują przedział ciała, czas wystąpienia i nasilenie nowotworów17. Ponadto, allele mdl manifestują się u platyfusów jako duża różnorodność genetycznie zdefiniowanych wzorów pigmentu. Zmapowany genom pozwolił nam na wykluczenie wielu genów pigmentu jako czynników odpowiedzialnych za te związane z płcią warianty pigmentu i modyfikatory czerniaka. Wszystkie znane geny pigmentu18 były obecne w genomie XX samic platyfish; tak więc żaden z nich nie jest specyficzny dla chromosomu Y. Tylko 6 ze 174 znanych genów pigmentu (asip2a, egfrb, muted, myca, rps20 i tfap2a) było zlokalizowanych na chromosomie X (Xma21). Spośród tych sześciu, tylko proto-onkogen egfrb znajdował się wystarczająco blisko onkogenu czerniaka xmrk (Tabela uzupełniająca 4), aby uznać go za gen kandydujący dla mdl. Rzeczywiście, badania biochemiczne wykazały, że Egfrb może współpracować z Xmrk19, ale poziomy ekspresji tych genów są odwrotnie regulowane w czerniaku20. Potrzebne są dalsze badania w celu oceny funkcji egfrb i znalezienia innych kandydatów na geny nieklasycznej pigmentacji w tym regionie genomowym, które mogą kontrolować zarówno wzór pigmentu jak i fenotyp czerniaka.

Kolejnym do tej pory niezidentyfikowanym składnikiem genetycznym modelu czerniaka Xiphophorus jest gen R/Diff. R/Diff hamuje powstawanie czerniaka u dzikich platyfusów, a eliminacja jego ekspresji poprzez hybrydyzację międzygatunkową umożliwia wzrost guza. R/Diff został zmapowany do 10-cM interwału na Xma5 w pobliżu locus cdkn2a/b21. Mimo że ortologiczny ludzki gen CDKN2A jest dobrze opisanym genem supresorowym nowotworów w niektórych ludzkich czerniakach22, cdkn2a/b został wykluczony z R/Diff, ponieważ nie jest zmutowany, lecz ulega nadekspresji w modelu czerniaka Xiphophorus23. Sekwencja Xma5 definiuje teraz szereg genów kandydujących do R/Diff do dalszej eksploracji. Na przykład, rusztowanie 182 (1,085,500 bp), które zawiera cdkn2a/b, zawiera kilka genów o wysokim potencjale do pełnienia roli supresora nowotworów R/Diff (na przykład tet2, cxxc4, mtap, topo-rs, mdx4 i pdcd4a). Alternatywnie, region ten może reprezentować złożone locus obejmujące kilka genów, które działają w sposób synergistyczny lub kompensacyjny w celu regulacji onkogenu xmrk, zgodnie z wcześniejszymi doniesieniami o spontanicznej i indukowanej kancerogenezie w wielu modelach hybrydowych guzów Xiphophorus międzygatunkowych24,25,26.

Viviparity jest skomplikowany tryb reprodukcyjny obejmujący różne poziomy matczynych inwestycji w potomstwo, począwszy od pełnego zaopatrzenia jaj przed zapłodnieniem i utrzymanie ich przez rozwój do minimalnie zaopatrzenia jaj przed zapłodnieniem i dostarczanie ich po zapłodnieniu przez łożysko, jak u ssaków. Rodzina ryb Poeciliidae, monofiletyczny klad obejmujący ponad 260 gatunków27, jest niezwykła, ponieważ zawiera gatunki, które obejmują spektrum od znikomego do ekstensywnego odżywiania po zapłodnieniu28,29. Genom platyfusa jest pierwszym genomem pochodzącym od kręgowca żyworodnego nie będącego ssakiem. Przeprowadziliśmy analizę 3 grup genów wiwipolarności (geny żółtka, łożyska i płaszcza jaja; n = 34) pod kątem utraty genów i pozytywnej selekcji w porównaniu z 4 gatunkami jajorodnych teleostów (medaka, tetraodon, ciernik i zebrafish) u platyfona, jak również u drugiej żyworodnej ryby.

W ssakach zaproponowano, że powstanie żyworodności wiąże się z postępującą utratą vitellogenin (prekursorów żółtka)32. U racicznicy i mieczyka wszystkie geny związane z żółtkiem (witellogeniny i ich transportery/receptory; Supplementary Table 5) były obecne i ewoluowały pod wpływem selekcji oczyszczającej, zgodnie z tym, że oba gatunki w pełni zaopatrywały jaja przed zapłodnieniem, z wyjątkiem jednego genu, który ewoluował pod wpływem selekcji pozytywnej, witellogeniny1 (Supplementary Fig. 5a).

Trzy z 13 genów platyfish, których ortologi u ssaków są związane z rozwojem łożyska, ewoluowały pod wpływem pozytywnej selekcji (Fig. 4a, Supplementary Fig. 5b-d i Supplementary Table 5). Igf2, który u myszy reguluje przepuszczalność łożyska33, ewoluował pod wpływem silnej pozytywnej selekcji u platyfusów (ryc. 4a), która szczególnie dotknęła region dystalny do miejsca proteolizy. Sekwencja igf233 była również dostępna u innego poeciliida, topinambura pustynnego Poeciliopsis lucida, który dzieli żyworodnego przodka z gatunkami Xiphophorus, ale różni się tym, że łożysko wyewoluowało niedawno. U topinambura pustynnego ten sam region co u platyfish ewoluował pod wpływem pozytywnej selekcji, ale była ona jeszcze silniejsza (Supplementary Fig. 5b), co sugeruje trwającą molekularną ewolucję adaptacyjną od czasu, gdy dwa rodzaje zawierające te ryby rozdzieliły się kilka milionów lat temu. Dwa inne geny łożyskowe, pparg i ncoa6, miały wiele regionów z sygnałami pozytywnej selekcji poza znanymi domenami funkcjonalnymi, co sugeruje nowe regiony ważne dla wiwipolarności. Te same geny podlegające selekcji u ryb żyworodnych nie wykazywały jednak pozytywnych sygnatur selekcyjnych, gdy analizowano ortologiczne geny pochodzące od składającego jaja platypusa oraz od ssaków marsupialnych i łożyskowych (Tabela 6). Wynik ten jest zgodny z faktem, że łożyska ssaków i ryb są strukturami zbieżnymi, ale nie homologicznymi.

Rysunek 4: Prawdopodobieństwa potomne dla klas miejsc w ramach alternatywnych modeli wzdłuż genu dla każdego miejsca aminokwasowego obliczonego przez empiryczną analizę Bayesa.
figure4

Miejsca klasy 1 podlegają selekcji oczyszczającej (stosunek Ka/Ks równy ∼0), miejsca klasy 2 podlegają selekcji neutralnej (stosunek Ka/Ks równy ∼1), a miejsca klasy 3 podlegają selekcji pozytywnej u gatunków Xiphophorus. (a) Insulinopodobny czynnik wzrostu 2 (IGF2). Kolorowe słupki poniżej wykresu pokazują znane domeny funkcjonalne, a strzałka wskazuje miejsce proteolizy (pomiędzy resztami 118 i 119). (b) ChoriogeninaH minor. U góry, porównanie ryb składających jaja z rybami żyworodnymi. Na dole porównanie ssaków łożyskowych z niełożyskowymi. Te same regiony podlegają pozytywnej selekcji u ryb i ssaków.

Geny Zona pellucida (Zpc), które wytwarzają bogaty w glikoproteiny płaszcz otaczający błonę plazmatyczną oocytu, wykazały najwyraźniejsze zmiany. alveolin został utracony z genomu platyfusa. Natomiast choriogeninaH minor, choriolizynaL, choriolizynaH i zvep ewoluowały pod wpływem pozytywnej selekcji (ryc. 4b, uzupełniające ryc. 5e-g i uzupełniająca tabela 5). U Xenopus laevis geny Zpc kontroluj± specyficzne dla gatunku wi±zanie plemników i pomagaj± zapewnić, że tylko specyficzne plemniki uwalniane do ¶rodowiska wodnego zapładniaj± jaja34. U ryb żyworodnych dochodzi jednak do zapłodnienia wewnętrznego, gdzie rozpoznawanie specyficznych gatunkowo plemników nie jest tak istotne. W porównaniu z rybami składającymi jaja, można się spodziewać, że skorupa jajowa u tych ryb przystosowała się do rozwoju wewnątrz matki, ponieważ nie jest już niezbędna do ochrony, ale musi ułatwiać wymianę gazową i materiałową. Geny enzymów wylęgowych zvep i choriolizynyH wykazały szybko ewoluujące miejsca, zlokalizowane na ogół w pobliżu domen katalitycznych (Supplementary Fig. 4f,g), co wskazuje, że podczas ewolucji wiwipolarności enzymy te mogły zmienić interakcje z białkami docelowymi lub regulatorowymi. Zauważmy, że w choriogeninieH minor, te same regiony, w szczególności w domenie zona pellucida, ewoluowały pod wpływem pozytywnej selekcji zarówno u ssaków, jak i u ryb (ryc. 4b). Jest to widoczny przykład tego, jak zbieżna ewolucja na poziomie molekularnym przejawia się na poziomie fizjologicznym i ostatecznie morfologicznym.

Nasze analizy konsekwencji TGD odkryły funkcjonalną klasę genów, która wzbudziła nasze zainteresowanie, ponieważ ryby Xiphophorus w szczególności i teleosty w ogóle wykazują wyraźny wysoki poziom złożoności behawioralnej35, którego nie osiągają inne grupy „zimnokrwistych” kręgowców, takich jak płazy i gady. Używając genomu platyfusa i anotacji genów z sześciu innych sekwencjonowanych teleostów, zapytaliśmy, czy duplikacja genów zachowana po zdarzeniu TGD mogła wytworzyć poprzez subfunkcjonalizację (zróżnicowane zachowanie subfunkcji przodków) i/lub neofunkcjonalizację (nabycie nowych subfunkcji)36 nabycie bardziej złożonych zachowań. Porównaliśmy 190 genów związanych z poznaniem (Tabela uzupełniająca 7 i Uwaga uzupełniająca) do tych zaangażowanych w pigmentację (133 geny, dla których zwiększony repertuar genów został powiązany z wysoką złożonością i różnorodnością ubarwienia teleostów) i funkcje wątroby (187 genów)18 jako kontroli. Analiza genów związanych z poznaniem wykazała wysoki wskaźnik retencji duplikatów wynoszący 45% u platyfusów i podobne wartości u innych teleostów (Rys. 5 i Supplementary Fig. 6) w porównaniu do wskaźników zaobserwowanych dla genów związanych z pigmentacją (30%) i funkcją wątroby (15%). Średni wskaźnik retencji duplikatów dla wszystkich genów w genomach teleostów szacowany jest na 12-24% (ref. 37). Nie znaleźliśmy żadnego odchylenia w genach ze wszystkich trzech kategorii funkcjonalnych (poznania, pigmentacji i funkcji wątroby), które zostały zachowane po TGD z powodu wrażliwości na dawkę lub przynależności do kompleksu białkowego (Tabele uzupełniające 8 i 9 oraz Uwaga uzupełniająca), ale stwierdzono odchylenie w genach poznania (ale nie funkcji wątroby i genach pigmentacji) dla szczególnie dużych białek (>1000 aminokwasów długości) (Rys. 7, Tabela uzupełniająca 10 i Uwaga uzupełniająca). Wykreślenie strat genów na drzewie filogenetycznym pokazało, że retencja genów poznania była już ustalona krótko po TGD i przed dywersyfikacją teleostów. To odkrycie wspiera hipotezę, że retencja paralogów z wydarzenia TGD mogła wspierać wysoki poziom złożoności behawioralnej u Xiphophorus i innych teleostów.

Rycina 5: Zróżnicowana retencja duplikatów genów w poznaniu, pigmentacji i klasach funkcjonalnych wątroby u teleostów po TGD.
figure5

(a) Wskaźniki retencji dla pochodzących z TGD duplikatów genów związanych z poznaniem, pigmentacją i funkcją wątroby w siedmiu genomach teleostów. Punkty czasowe podczas ewolucji teleostów, które obejmują linię prowadzącą do Xiphophorus są połączone liniami. (b) Filogenetyczne mapowanie utraty genów dla 190 par duplikatów genów związanych z poznaniem po TGD. Straty są zaznaczone wartościami ujemnymi. Liczba zachowanych par paralogów TGD dla każdego genomu teleostów podana jest w nawiasach. Utrata paralogów TGD została naniesiona na filogenezę teleostów podaną przez Setiamarga i wsp.39 zgodnie z zasadą parsymonii. Wydarzenie TGD zostało ustalone na 350 milionów lat temu. Wskaźnik retencji paralogów TGD jest definiowany przez liczbę par duplikatów pochodzących z TGD obecnych w konkretnej linii podzieloną przez liczbę par duplikatów pochodzących z TGD obecnych w czasie TGD18.

Sekwencja genomu i analiza genomu platyfish dostarczyły nowych perspektyw dla kilku wybitnych cech tego modelu ryby, w tym jej trybu rozrodczego, zmienności wzorców pigmentacji, ewolucji chromosomów płciowych w działaniu, złożonego zachowania i zarówno spontanicznej jak i indukowanej kancerogenezy17. Teleosty dominują w istniejącej faunie ryb, a w obrębie teleostów (Rys. 1b) rodzina Poeciliidae, w tym platyfidy, mieczyki, gupiki i molinezje, jest paradygmatem tego szerokiego spektrum adaptacji. Nasze badania tego pierwszego genomu ryb poeciliidalnych oświetlają niektóre ewolucyjne adaptacje teleostów i dostarczają ważnych zasobów do dalszych badań nad czerniakiem i innymi fenotypami segregującymi.

.