Articles

Das Genom des Platyfisches, Xiphophorus maculatus, bietet Einblicke in die evolutionäre Anpassung und mehrere komplexe Merkmale

Wir sequenzierten das gesamte Genom eines einzelnen Platyfisch-Weibchens (XX, 2n = 46 Chromosomen, Jp163A-Stamm; Abb. 1) aus Generation 104 von kontinuierlichen Bruder-Schwester-Paarungen. Die 19,6-fache Sequenzabdeckung (siehe Anhang) führte zu einer Assemblierung mit N50-Contig- und Super-Contig-Längen von 22 kb bzw. 1,1 Mb (siehe Anhang Tabelle 1). Assembly-Fehler, meist Einzel-Nukleotid-Insertionen oder Deletionen, wurden mit Illumina Paired-End-Reads korrigiert. Insgesamt wurden 669 Mb der geschätzten Genomlänge von 750-950 Mb in Contigs assembliert. Durch Genvorhersagen wurden 20.366 kodierende Gene, 348 nicht kodierende Gene und 28 Pseudogene identifiziert (ergänzende Anmerkung).

Abbildung 1: Der Platyfisch, X. maculatus.
figure1

(a) Weibliche (oben) und männliche (unten) Platyfische des Stammes Jp163A mit schwarzen Pigmentflecken auf der Rückenflosse, die sich entwickeln, wenn die Aktivität eines X-chromosomalen Onkogens entsprechend kontrolliert wird. Bei hybriden Genotypen ist diese Kontrolle beeinträchtigt, und aus den Flecken entwickelt sich ein malignes Melanom. (b) Phylogenetische Position des Platyfisches im Vergleich zu anderen Fischarten.

Wie bei anderen Teleosten waren die transponierbaren Elemente (TEs) bei Platyfischen sehr vielfältig, einschließlich vieler Familien, die bei Säugetieren1 und Vögeln fehlen (ergänzende Abbildungen 1-3, ergänzende Tabellen 2 und 3 und ergänzende Anmerkung). Wir fanden heraus, dass 4,8 % des Transkriptoms von TE-Sequenzen aus etwa 40 verschiedenen Familien stammten, was darauf hindeutet, dass viele der TEs bei Platyfischen höchstwahrscheinlich noch aktiv sind. Die aktivsten TEs waren Tc1-DNA-Transposons (>16.000 Kopien), gefolgt von der RTE-Familie (>9.000 Kopien). Bemerkenswert ist, dass wir mehrere fast intakte, für die Hülle kodierende Kopien eines schaumigen Retrovirus (Spumaviridae) identifiziert haben, die in das Platyfisch-Genom integriert sind (Abb. 2). Foamy-Viren sind als exogene Infektionserreger bei Säugetieren bekannt2. Erst vor kurzem wurden endogene Foamyvirus-Sequenzen, die als fossile Aufzeichnungen von Infektionen dienen können, in den Genomen von Faultieren3 und Jägern4 bei Säugetieren sowie bei Quastenflossern5 beschrieben. Eine Foamy-Virus-ähnliche Sequenz im Zebrafisch6, eine im Rahmen dieser Arbeit entdeckte Sequenz im Kabeljau und die hier berichtete Platyfisch-Genomsequenz zeigen ein noch breiteres Spektrum an Wirten. Die molekulare Phylogenie der Foamyviren stimmt mit der Wirtsphylogenie überein (Abb. 2). Dieses Ergebnis unterstützt die Vorstellung eines alten marinen evolutionären Ursprungs dieses Virustyps mit möglicher Wirts-Virus-Koevolution5. Die nahezu intakten Kopien des Foamy-Virus, die in den Genomen einiger divergenter Fischarten gefunden wurden und in anderen sequenzierten Fischgenomen nicht vorhanden sind, könnten auf eine unabhängige Keimbahneinführung durch Infektion hinweisen. Exogene Foamy-Viren wurden bei Fischen nicht beschrieben; unsere Ergebnisse deuten jedoch darauf hin, dass exogene Foamy-Viren in der Fischabstammung infektiös waren und möglicherweise immer noch sind.

Abbildung 2: Phylogenetischer Baum endogener Retroviren auf der Grundlage von Reverse-Transkriptase-Proteinsequenzen.
figure2

Schaumvirus (FV)-Sequenzen (hellblaue Schattierung) bilden zwei unterschiedliche phylogenetische Gruppen, eine tetrapodenspezifische und eine teleostspezifische. Beide Gruppen enthalten endogene Foamy-Virus-Sequenzen (EFV) (die neu identifizierten Platyfish- und Kabeljau-Sequenzen sind durch dunkelblaue Schattierung hervorgehoben). Die Zuordnung erfolgte mit ClustalW (223 Aminosäuren), und der phylogenetische Baum wurde mit dem PhyML-Paket unter Verwendung von Maximum-Likelihood-Methoden38 mit Standard-Bootstrap (am Anfang der Zweige angezeigt) und optimierten Berechnungsoptionen erstellt. FV, Foamy-Virus; MuERV-L, Mus musculus endogenes Retrovirus-L; BAEV, endogenes Pavian-Virus; FENV1, felines endogenes Virus 1; EFV, endogenes Foamy-Virus; MLV, murines Leukämie-Virus; HERV-K, humanes endogenes Retrovirus-K; MMTV, Maus-Mammatumor-Virus; HIV-1, humanes Immunschwäche-Virus-1. Die Skala gibt die Anzahl der Substitutionen pro Stelle an.

Die Chromosomen-Homologiekarten von Säugetieren zeigen ein Flickwerk aus durchschnittlich 35 großen konservierten Syntenie-Blöcken (aber etwa 80 bei Hunden und 200 bei Mäusen) und zahlreichen kleinen Blöcken, die bei den verschiedenen Arten in unterschiedlichen Kombinationen zusammengesetzt sind und über 90 Millionen Jahre Evolution umfassen7. Wir haben die umfangreichste meiotische genetische Karte für ein Wirbeltier erstellt, die bisher veröffentlicht wurde. Dies ermöglichte die Anordnung der Gerüste von X. maculatus und eine präzise Analyse der konservierten Syntenie beim Vergleich von Fischgenomen (siehe Anhang). Wir verwendeten den innovativen Restriktionsstellen-assoziierten DNA (RAD)-Ansatz8 , um eine meiotische Karte zu erstellen, die aus 16.245 polymorphen Markern besteht, die 24 Verknüpfungsgruppen definieren, die der haploiden Chromosomenzahl des Platyfisches entsprechen9. So konnten 90,17 % der gesamten Sequenzen in den Contigs einer chromosomalen Position zugeordnet werden. Langfristige Vergleiche der Reihenfolge von Genen zwischen verschiedenen Arten10 ergaben neue evolutionäre Beziehungen zwischen Platyfischen und anderen Teleost-Chromosomen. Medaka, der nächste Verwandte mit einem sequenzierten Genom, hat ebenfalls 24 Chromosomen, von denen 19 eine strikte Eins-zu-Eins-Beziehung zu den Platyfisch-Chromosomen aufweisen (Abb. 3a,b). Die übrigen fünf Platyfisch-Chromosomen waren ebenfalls jeweils ortholog zu einem einzelnen Medaka-Chromosom, mit Ausnahme von ein oder zwei kurzen Segmenten (∼1 Mb lang), die sich auf einem anderen Medaka-Chromosom befanden (Abb. 3c und ergänzende Abb. 4). Somit haben eine ganze Reihe von Translokationen, die alle sehr kurz sind, das Karyotyp seit der Divergenz von Medaka und Platyfish vor 120 Millionen Jahren gestört11,12. Ein ähnliches Bild ergab sich beim Vergleich der Platyfisch-Chromosomen mit denen des Stichlings (Divergenz vor 180 Millionen Jahren)11,12. Diese Ergebnisse zeigen das bisher unbekannte Ausmaß, in dem der genetische Inhalt der Chromosomen dieser Teleosteer über einen Zeitraum von fast 200 Millionen Jahren konserviert wurde – eine Konservierung, die weitaus größer ist als die von Säugetieren über etwa die Hälfte dieser Zeit7,11,12. Dies ist angesichts des Ereignisses der Genomverdopplung (TGD) bei den Teleosteern etwas unerwartet, denn man hätte annehmen können, dass die illegitime Paarung paraloger Chromosomen (die aus der TGD resultiert) Translokationen begünstigt hätte. Die Mechanismen, die solche Translokationen abgemildert haben könnten, bleiben unbekannt.

Abbildung 3: Konservierte Syntenien zwischen Platyfish und Medaka.
figure3

(a) Die Medaka-Orthologe von Genen auf X. maculatus-Chromosom 9 (Xma9) liegen in der Regel auf Oryzias latipes-Chromosom 4 (Ola4), was zeigt, dass der genetische Inhalt dieser Chromosomen in den 120 Millionen Jahren, seit sich die Linien dieser Arten getrennt haben, ohne Translokationen intakt geblieben ist. Jeder graue Punkt auf der horizontalen Achse mit der Bezeichnung Xma9 steht für die Position eines Platyfisch-Gens, dessen Medaka-Ortholog (gemäß der reziproken Best-BLAST-Trefferanalyse) direkt senkrecht zum Xma9-Gen liegt, das auf dem entsprechenden Medaka-Chromosom10 aufgetragen ist. (b) Umgekehrt liegen fast alle Platyfish-Orthologe von Genen auf dem Medaka-Chromosom Ola4 auf Xma9. (c) Fast alle Medaka-Orthologe von Xma19 liegen auf Ola22, mit Ausnahme eines etwa 1 Mb langen Abschnitts an Position 20 Mb auf Ola22, der auf Ola24 erscheint (gestrichelter Kasten).

Der Plattfisch ist ein bekanntes Modell in der Krebsforschung13. Sein Genom enthält eine Tumorkontrollregion (TCR), einschließlich des Onkogens xmrk14, das die Melanomentwicklung auslöst. Die TCR enthält auch den Tumormodifikator mdl15,16. Allelvarianten von mdl steuern das Körperkompartiment, den Zeitpunkt des Auftretens und die Schwere von Tumoren17. Darüber hinaus manifestieren sich mdl-Allele bei Platyfischen in einer großen Vielfalt genetisch definierter Pigmentmuster. Das kartierte Genom ermöglichte es uns, viele Pigmentgene als verantwortliche Faktoren für diese geschlechtsassoziierten Pigmentvarianten und Melanom-Modifikatoren auszuschließen. Alle bekannten Pigmentgene18 waren im Genom der XX-weiblichen Platyfische vorhanden; keines ist also Y-Chromosom-spezifisch. Nur 6 der 174 bekannten Pigmentgene (asip2a, egfrb, muted, myca, rps20 und tfap2a) befanden sich auf dem X-Chromosom (Xma21). Von diesen sechs Genen lag nur das Proto-Onkogen egfrb nahe genug an dem Melanom-Onkogen xmrk (ergänzende Tabelle 4), um als Kandidat für mdl in Frage zu kommen. In der Tat haben biochemische Studien gezeigt, dass Egfrb mit Xmrk zusammenarbeiten kann19, aber die Expressionsniveaus dieser Gene sind beim Melanom umgekehrt reguliert20. Weitere Studien sind erforderlich, um die Funktion von Egfrb zu bewerten und andere nicht-klassische Pigmentierungsgene in dieser genomischen Region zu finden, die sowohl das Pigmentmuster als auch den Melanomphänotyp kontrollieren könnten.

Eine weitere, bisher nicht identifizierte genetische Komponente des Xiphophorus-Melanom-Modells ist das R/Diff-Gen. R/Diff unterdrückt die Melanombildung in wilden Platyfischen, und die Eliminierung seiner Expression durch Interspezies-Hybridisierung ermöglicht das Tumorwachstum. R/Diff wurde in einem 10-cM-Intervall auf Xma5 in der Nähe des cdkn2a/b-Lokus21 kartiert. Obwohl das orthologe menschliche CDKN2A-Gen ein gut beschriebenes Tumorsuppressor-Gen in bestimmten menschlichen Melanomen ist22, wurde cdkn2a/b als R/Diff ausgeschlossen, da es nicht mutiert ist, sondern im Xiphophorus-Melanom-Modell überexprimiert wird23. Die Xma5-Sequenz definiert nun eine Reihe von R/Diff-Kandidatengenen für weitere Untersuchungen. Das Gerüst 182 (1.085.500 bp), das cdkn2a/b beherbergt, enthält beispielsweise mehrere Gene mit hohem Potenzial für eine Rolle als R/Diff-Tumorsuppressor (z. B. tet2, cxxc4, mtap, topo-rs, mdx4 und pdcd4a). Alternativ könnte die Region einen komplexen Locus darstellen, der mehrere Gene umfasst, die auf synergistische oder kompensatorische Weise wirken, um das xmrk-Onkogen zu regulieren, was mit früheren Berichten über spontane und induzierte Karzinogenese in den vielen Xiphophorus-Hybrid-Tumormodellen übereinstimmt24,25,26.

Viviparität ist ein ausgeklügelter Fortpflanzungsmodus, der verschiedene Ebenen mütterlicher Investitionen in die Nachkommenschaft umfasst, die von der vollständigen Versorgung der Eier vor der Befruchtung und deren Erhalt während der Entwicklung bis hin zur minimalen Versorgung der Eier vor der Befruchtung und deren Versorgung nach der Befruchtung über die Plazenta, wie bei Säugetieren, reichen. Die Fischfamilie Poeciliidae, eine monophyletische Gruppe mit mehr als 260 Arten27, ist insofern ungewöhnlich, als sie Arten umfasst, die das Spektrum von vernachlässigbarer bis zu umfangreicher Versorgung nach der Befruchtung abdecken28,29. Das Platyfisch-Genom ist das erste eines lebendgebärenden Wirbeltiers, das kein Säugetier ist. Wir analysierten bei Platyfischen sowie bei einem zweiten lebendgebärenden Fisch, dem Schwertträger Xiphophorus hellerii, die beide vor der Befruchtung gut mit Eiern versorgt sind30,31, drei Gruppen von Viviparitätsgenen (Dotter-, Plazenta- und Eihüllengene; n = 34) auf Genverlust und positive Selektion im Vergleich zu vier Arten eierlegender Teleosteer (Medaka, Tetraodon, Stichling und Zebrafisch).

Bei Säugetieren wurde vorgeschlagen, dass die Entstehung der Viviparie mit dem fortschreitenden Verlust der Vitellogenine (Dottervorläufer) einhergeht32. Bei Platyfish und Schwertträger waren alle mit dem Dotter zusammenhängenden Gene (Vitellogenine und ihre Transporter/Rezeptoren; ergänzende Tabelle 5) vorhanden und entwickelten sich unter reinigender Selektion, was damit übereinstimmt, dass beide Arten die Eier vor der Befruchtung vollständig versorgen, mit Ausnahme eines Gens, das sich unter positiver Selektion entwickelte, Vitellogenin1 (ergänzende Abb. 5a).

Drei von 13 Platyfischgenen, deren Säugetierorthologe mit der Plazentaentwicklung zusammenhängen, entwickelten sich unter positiver Selektion (Abb. 4a, ergänzende Abb. 5b-d und ergänzende Tabelle 5). Igf2, das in der Maus die Durchlässigkeit der Plazenta reguliert33, entwickelte sich unter starker positiver Selektion in Platyfish (Abb. 4a), die insbesondere die Region distal der Proteolyse-Stelle betraf. Die igf2-Sequenz33 war auch von einem anderen Poeciliiden, dem Wüstenhahn Poeciliopsis lucida, verfügbar, der einen lebendgebärenden Vorfahren mit Xiphophorus-Arten teilt, sich aber dadurch unterscheidet, dass sich die Plazentation erst kürzlich entwickelt hat. Beim Wüstenhund entwickelte sich dieselbe Region wie beim Platyfish unter positiver Selektion, aber die Selektion war sogar noch stärker (ergänzende Abb. 5b), was auf eine fortlaufende molekulare adaptive Evolution seit der Trennung der beiden Gattungen, die diese Fische enthalten, vor mehreren Millionen Jahren hindeutet. Die beiden anderen Plazenta-Gene, pparg und ncoa6, wiesen mehrere Regionen mit Signalen für positive Selektion außerhalb bekannter Funktionsbereiche auf, was auf neuartige, für die Viviparität wichtige Regionen schließen lässt. Dieselben Gene, die bei lebendgebärenden Fischen unter Selektion stehen, zeigten jedoch keine positiven Selektionssignaturen, wenn orthologe Gene vom eierlegenden Schnabeltier sowie von Beuteltieren und plazentaren Säugetieren analysiert wurden (ergänzende Tabelle 6). Dieses Ergebnis steht im Einklang mit der Tatsache, dass die Plazenten von Säugetieren und Fischen konvergente, aber nicht homologe Strukturen sind.

Abbildung 4: Posteriorwahrscheinlichkeiten für Standortklassen unter alternativen Modellen entlang des Gens für jeden Aminosäurestandort, berechnet durch empirische Bayes-Analyse.
figure4

Standorte der Klasse 1 unterliegen einer reinigenden Selektion (Ka/Ks-Verhältnis von ∼0), Standorte der Klasse 2 unterliegen einer neutralen Selektion (Ka/Ks-Verhältnis von ∼1) und Standorte der Klasse 3 unterliegen einer positiven Selektion bei Xiphophorus-Arten. (a) Insulinähnlicher Wachstumsfaktor 2 (IGF2). Farbige Balken unter dem Diagramm zeigen bekannte funktionelle Domänen, und der Pfeil zeigt die Proteolyse-Stelle (zwischen den Resten 118 und 119). (b) ChoriogeninH minor. Oben: Vergleich von eierlegenden und lebendgebärenden Fischen. Unten: Vergleich von plazentaren und nicht plazentaren Säugetieren. Die gleichen Regionen stehen bei Fischen und Säugetieren unter positiver Selektion.

Die Gene der Zona pellucida (Zpc), die eine glykoproteinreiche Hülle produzieren, die die Plasmamembran der Eizelle umgibt, wiesen die ausgeprägtesten Veränderungen auf. alveolin wurde aus dem Platyfish-Genom entfernt. Im Gegensatz dazu entwickelten sich ChoriogeninH minor, ChoriolysinL, ChoriolysinH und zvep unter positiver Selektion (Abb. 4b, ergänzende Abb. 5e-g und ergänzende Tabelle 5). In Xenopus laevis steuern die Zpc-Gene die artspezifische Spermienbindung und tragen dazu bei, dass nur artgleiche Spermien, die in die wässrige Umgebung abgegeben werden, die Eier befruchten34. Bei lebendgebärenden Fischen findet die Befruchtung jedoch intern statt, so dass die Erkennung artspezifischer Spermien nicht so wichtig ist. Im Vergleich zu eierlegenden Fischen dürfte sich die Eischale bei diesen Fischen an die Entwicklung im Inneren des Muttertieres angepasst haben, da sie nicht mehr für den Schutz notwendig ist, sondern den Gas- und Materialaustausch erleichtern muss. Die Enzymgene zvep und choriolysinH wiesen schnell wachsende Stellen auf, die sich im Allgemeinen in der Nähe der katalytischen Domänen befanden (ergänzende Abb. 4f,g), was darauf hindeutet, dass diese Enzyme während der Evolution der Viviparität möglicherweise veränderte Interaktionen mit Ziel- oder Regulierungsproteinen hatten. Bemerkenswert ist, dass sich in ChoriogeninH minor dieselben Regionen, insbesondere in der Zona pellucida-Domäne, unter positiver Selektion sowohl bei Säugetieren als auch bei Fischen entwickelt haben (Abb. 4b). Dies ist ein bemerkenswertes Beispiel dafür, wie sich konvergente Evolution auf molekularer Ebene auf der physiologischen und letztlich morphologischen Ebene manifestiert.

Unsere Analysen der Folgen von TGD haben eine funktionelle Klasse von Genen aufgedeckt, die unser Interesse geweckt hat, weil Xiphophorus-Fische im Besonderen und Teleoste im Allgemeinen ein ausgesprochen hohes Maß an Verhaltenskomplexität35 aufweisen, das andere Gruppen von „kaltblütigen“ Wirbeltieren wie Amphibien und Reptilien nicht erreichen. Anhand des Platyfisch-Genoms und der Genannotationen von sechs anderen sequenzierten Teleostierarten fragten wir, ob die doppelte Genretention aus dem TGD-Ereignis durch Subfunktionalisierung (differenzielle Beibehaltung von Unterfunktionen der Vorfahren) und/oder Neofunktionalisierung (Erwerb neuer Unterfunktionen)36 den Erwerb komplexerer Verhaltensweisen bewirken könnte. Wir verglichen 190 kognitionsbezogene Gene (ergänzende Tabelle 7 und ergänzende Anmerkung) mit jenen, die an der Pigmentierung (133 Gene, für die ein größeres Genrepertoire mit der hohen Komplexität und Vielfalt der Teleost-Färbung in Verbindung gebracht wurde) und den Leberfunktionen (187 Gene)18 als Kontrollen beteiligt sind. Die Analyse der Gene, die mit der Wahrnehmung zusammenhängen, ergab eine hohe Rate der doppelten Beibehaltung von 45 % bei Platyfischen und ähnliche Werte bei anderen Teleosteern (Abb. 5 und ergänzende Abb. 6), verglichen mit den Raten für Gene, die mit der Pigmentierung (30 %) und der Leberfunktion (15 %) zusammenhängen. Die durchschnittliche Rate der doppelten Beibehaltung aller Gene in Teleost-Genomen wird auf 12-24 % geschätzt (Ref. 37). Wir fanden keine Verzerrung bei Genen aus allen drei Funktionskategorien (Wahrnehmung, Pigmentierung und Leberfunktion), die nach TGD aufgrund von Dosisempfindlichkeit oder Zugehörigkeit zu Proteinkomplexen beibehalten wurden (ergänzende Tabellen 8 und 9 und ergänzende Anmerkung), aber es wurde eine Verzerrung bei den Wahrnehmungsgenen (aber nicht bei den Leberfunktions- und Pigmentierungsgenen) für besonders große Proteine (>1.000 Aminosäuren lang) festgestellt (ergänzende Abb. 7, ergänzende Tabelle 10 und ergänzende Anmerkung). Die Darstellung der Genverluste auf dem phylogenetischen Baum zeigte, dass die Beibehaltung der Wahrnehmungsgene bereits kurz nach dem TGD und vor der Diversifizierung der Teleosteer festgelegt wurde. Dieser Befund stützt die Hypothese, dass die Retention von Paralogen aus dem TGD-Ereignis das hohe Maß an Verhaltenskomplexität bei Xiphophorus und anderen Teleosten unterstützt haben könnte.

Abbildung 5: Unterschiedliche Retention von Genduplikaten in Kognition, Pigmentierung und Leberfunktionsklassen bei Teleosten nach TGD.
figure5

(a) Retentionsraten für TGD-abgeleitete Genduplikate von Genen, die mit Kognition, Pigmentierung und Leberfunktion in sieben Teleost-Genomen zusammenhängen. Zeitpunkte der Teleost-Evolution, die die zu Xiphophorus führende Abstammungslinie betreffen, sind durch Linien verbunden. (b) Phylogenetische Kartierung der Genverluste für 190 Paare von kognitionsbezogenen Genduplikaten nach TGD. Verluste sind mit negativen Werten angegeben. Die Anzahl der erhaltenen TGD-Paralogpaare für jedes einzelne Teleost-Genom ist in Klammern angegeben. Die TGD-Paralogverluste wurden nach dem Parsimonieprinzip auf die von Setiamarga et al.39 erstellte Teleost-Phylogenie abgebildet. Das TGD-Ereignis wurde auf vor 350 Millionen Jahren festgelegt. Die Retentionsrate der TGD-Paraloge ist definiert durch die Anzahl der Paare von TGD-abgeleiteten Duplikaten, die in einer bestimmten Abstammungslinie vorhanden sind, geteilt durch die Anzahl der Paare von TGD-abgeleiteten Duplikaten, die zur Zeit des TGD18 vorhanden waren.

Die Genomsequenz und -analyse des Platyfisches haben neue Perspektiven für mehrere herausragende Merkmale dieses Fischmodells eröffnet, darunter seine lebendgebärende Fortpflanzungsweise, Variationen in den Pigmentierungsmustern, die Evolution der Geschlechtschromosomen in Aktion, komplexes Verhalten und sowohl spontane als auch induzierte Karzinogenese17. Teleosteer dominieren die heutige Fischfauna, und innerhalb der Teleosteer (Abb. 1b) ist die Familie der Poeciliidae, zu der Platyfische, Schwertträger, Guppys und Mollys gehören, ein Musterbeispiel für dieses breite Spektrum an Anpassungen. Unsere Studie dieses ersten Genoms eines Poeciliidenfisches beleuchtet einige evolutionäre Anpassungen der Teleosteer und stellt eine wichtige Ressource für die Untersuchung von Melanomen und anderen segregierenden Phänotypen dar.