Das Genom des Platyfisches, Xiphophorus maculatus, bietet Einblicke in die evolutionäre Anpassung und mehrere komplexe Merkmale
Wir sequenzierten das gesamte Genom eines einzelnen Platyfisch-Weibchens (XX, 2n = 46 Chromosomen, Jp163A-Stamm; Abb. 1) aus Generation 104 von kontinuierlichen Bruder-Schwester-Paarungen. Die 19,6-fache Sequenzabdeckung (siehe Anhang) führte zu einer Assemblierung mit N50-Contig- und Super-Contig-Längen von 22 kb bzw. 1,1 Mb (siehe Anhang Tabelle 1). Assembly-Fehler, meist Einzel-Nukleotid-Insertionen oder Deletionen, wurden mit Illumina Paired-End-Reads korrigiert. Insgesamt wurden 669 Mb der geschätzten Genomlänge von 750-950 Mb in Contigs assembliert. Durch Genvorhersagen wurden 20.366 kodierende Gene, 348 nicht kodierende Gene und 28 Pseudogene identifiziert (ergänzende Anmerkung).
Wie bei anderen Teleosten waren die transponierbaren Elemente (TEs) bei Platyfischen sehr vielfältig, einschließlich vieler Familien, die bei Säugetieren1 und Vögeln fehlen (ergänzende Abbildungen 1-3, ergänzende Tabellen 2 und 3 und ergänzende Anmerkung). Wir fanden heraus, dass 4,8 % des Transkriptoms von TE-Sequenzen aus etwa 40 verschiedenen Familien stammten, was darauf hindeutet, dass viele der TEs bei Platyfischen höchstwahrscheinlich noch aktiv sind. Die aktivsten TEs waren Tc1-DNA-Transposons (>16.000 Kopien), gefolgt von der RTE-Familie (>9.000 Kopien). Bemerkenswert ist, dass wir mehrere fast intakte, für die Hülle kodierende Kopien eines schaumigen Retrovirus (Spumaviridae) identifiziert haben, die in das Platyfisch-Genom integriert sind (Abb. 2). Foamy-Viren sind als exogene Infektionserreger bei Säugetieren bekannt2. Erst vor kurzem wurden endogene Foamyvirus-Sequenzen, die als fossile Aufzeichnungen von Infektionen dienen können, in den Genomen von Faultieren3 und Jägern4 bei Säugetieren sowie bei Quastenflossern5 beschrieben. Eine Foamy-Virus-ähnliche Sequenz im Zebrafisch6, eine im Rahmen dieser Arbeit entdeckte Sequenz im Kabeljau und die hier berichtete Platyfisch-Genomsequenz zeigen ein noch breiteres Spektrum an Wirten. Die molekulare Phylogenie der Foamyviren stimmt mit der Wirtsphylogenie überein (Abb. 2). Dieses Ergebnis unterstützt die Vorstellung eines alten marinen evolutionären Ursprungs dieses Virustyps mit möglicher Wirts-Virus-Koevolution5. Die nahezu intakten Kopien des Foamy-Virus, die in den Genomen einiger divergenter Fischarten gefunden wurden und in anderen sequenzierten Fischgenomen nicht vorhanden sind, könnten auf eine unabhängige Keimbahneinführung durch Infektion hinweisen. Exogene Foamy-Viren wurden bei Fischen nicht beschrieben; unsere Ergebnisse deuten jedoch darauf hin, dass exogene Foamy-Viren in der Fischabstammung infektiös waren und möglicherweise immer noch sind.
Die Chromosomen-Homologiekarten von Säugetieren zeigen ein Flickwerk aus durchschnittlich 35 großen konservierten Syntenie-Blöcken (aber etwa 80 bei Hunden und 200 bei Mäusen) und zahlreichen kleinen Blöcken, die bei den verschiedenen Arten in unterschiedlichen Kombinationen zusammengesetzt sind und über 90 Millionen Jahre Evolution umfassen7. Wir haben die umfangreichste meiotische genetische Karte für ein Wirbeltier erstellt, die bisher veröffentlicht wurde. Dies ermöglichte die Anordnung der Gerüste von X. maculatus und eine präzise Analyse der konservierten Syntenie beim Vergleich von Fischgenomen (siehe Anhang). Wir verwendeten den innovativen Restriktionsstellen-assoziierten DNA (RAD)-Ansatz8 , um eine meiotische Karte zu erstellen, die aus 16.245 polymorphen Markern besteht, die 24 Verknüpfungsgruppen definieren, die der haploiden Chromosomenzahl des Platyfisches entsprechen9. So konnten 90,17 % der gesamten Sequenzen in den Contigs einer chromosomalen Position zugeordnet werden. Langfristige Vergleiche der Reihenfolge von Genen zwischen verschiedenen Arten10 ergaben neue evolutionäre Beziehungen zwischen Platyfischen und anderen Teleost-Chromosomen. Medaka, der nächste Verwandte mit einem sequenzierten Genom, hat ebenfalls 24 Chromosomen, von denen 19 eine strikte Eins-zu-Eins-Beziehung zu den Platyfisch-Chromosomen aufweisen (Abb. 3a,b). Die übrigen fünf Platyfisch-Chromosomen waren ebenfalls jeweils ortholog zu einem einzelnen Medaka-Chromosom, mit Ausnahme von ein oder zwei kurzen Segmenten (∼1 Mb lang), die sich auf einem anderen Medaka-Chromosom befanden (Abb. 3c und ergänzende Abb. 4). Somit haben eine ganze Reihe von Translokationen, die alle sehr kurz sind, das Karyotyp seit der Divergenz von Medaka und Platyfish vor 120 Millionen Jahren gestört11,12. Ein ähnliches Bild ergab sich beim Vergleich der Platyfisch-Chromosomen mit denen des Stichlings (Divergenz vor 180 Millionen Jahren)11,12. Diese Ergebnisse zeigen das bisher unbekannte Ausmaß, in dem der genetische Inhalt der Chromosomen dieser Teleosteer über einen Zeitraum von fast 200 Millionen Jahren konserviert wurde – eine Konservierung, die weitaus größer ist als die von Säugetieren über etwa die Hälfte dieser Zeit7,11,12. Dies ist angesichts des Ereignisses der Genomverdopplung (TGD) bei den Teleosteern etwas unerwartet, denn man hätte annehmen können, dass die illegitime Paarung paraloger Chromosomen (die aus der TGD resultiert) Translokationen begünstigt hätte. Die Mechanismen, die solche Translokationen abgemildert haben könnten, bleiben unbekannt.
Der Plattfisch ist ein bekanntes Modell in der Krebsforschung13. Sein Genom enthält eine Tumorkontrollregion (TCR), einschließlich des Onkogens xmrk14, das die Melanomentwicklung auslöst. Die TCR enthält auch den Tumormodifikator mdl15,16. Allelvarianten von mdl steuern das Körperkompartiment, den Zeitpunkt des Auftretens und die Schwere von Tumoren17. Darüber hinaus manifestieren sich mdl-Allele bei Platyfischen in einer großen Vielfalt genetisch definierter Pigmentmuster. Das kartierte Genom ermöglichte es uns, viele Pigmentgene als verantwortliche Faktoren für diese geschlechtsassoziierten Pigmentvarianten und Melanom-Modifikatoren auszuschließen. Alle bekannten Pigmentgene18 waren im Genom der XX-weiblichen Platyfische vorhanden; keines ist also Y-Chromosom-spezifisch. Nur 6 der 174 bekannten Pigmentgene (asip2a, egfrb, muted, myca, rps20 und tfap2a) befanden sich auf dem X-Chromosom (Xma21). Von diesen sechs Genen lag nur das Proto-Onkogen egfrb nahe genug an dem Melanom-Onkogen xmrk (ergänzende Tabelle 4), um als Kandidat für mdl in Frage zu kommen. In der Tat haben biochemische Studien gezeigt, dass Egfrb mit Xmrk zusammenarbeiten kann19, aber die Expressionsniveaus dieser Gene sind beim Melanom umgekehrt reguliert20. Weitere Studien sind erforderlich, um die Funktion von Egfrb zu bewerten und andere nicht-klassische Pigmentierungsgene in dieser genomischen Region zu finden, die sowohl das Pigmentmuster als auch den Melanomphänotyp kontrollieren könnten.
Eine weitere, bisher nicht identifizierte genetische Komponente des Xiphophorus-Melanom-Modells ist das R/Diff-Gen. R/Diff unterdrückt die Melanombildung in wilden Platyfischen, und die Eliminierung seiner Expression durch Interspezies-Hybridisierung ermöglicht das Tumorwachstum. R/Diff wurde in einem 10-cM-Intervall auf Xma5 in der Nähe des cdkn2a/b-Lokus21 kartiert. Obwohl das orthologe menschliche CDKN2A-Gen ein gut beschriebenes Tumorsuppressor-Gen in bestimmten menschlichen Melanomen ist22, wurde cdkn2a/b als R/Diff ausgeschlossen, da es nicht mutiert ist, sondern im Xiphophorus-Melanom-Modell überexprimiert wird23. Die Xma5-Sequenz definiert nun eine Reihe von R/Diff-Kandidatengenen für weitere Untersuchungen. Das Gerüst 182 (1.085.500 bp), das cdkn2a/b beherbergt, enthält beispielsweise mehrere Gene mit hohem Potenzial für eine Rolle als R/Diff-Tumorsuppressor (z. B. tet2, cxxc4, mtap, topo-rs, mdx4 und pdcd4a). Alternativ könnte die Region einen komplexen Locus darstellen, der mehrere Gene umfasst, die auf synergistische oder kompensatorische Weise wirken, um das xmrk-Onkogen zu regulieren, was mit früheren Berichten über spontane und induzierte Karzinogenese in den vielen Xiphophorus-Hybrid-Tumormodellen übereinstimmt24,25,26.
Viviparität ist ein ausgeklügelter Fortpflanzungsmodus, der verschiedene Ebenen mütterlicher Investitionen in die Nachkommenschaft umfasst, die von der vollständigen Versorgung der Eier vor der Befruchtung und deren Erhalt während der Entwicklung bis hin zur minimalen Versorgung der Eier vor der Befruchtung und deren Versorgung nach der Befruchtung über die Plazenta, wie bei Säugetieren, reichen. Die Fischfamilie Poeciliidae, eine monophyletische Gruppe mit mehr als 260 Arten27, ist insofern ungewöhnlich, als sie Arten umfasst, die das Spektrum von vernachlässigbarer bis zu umfangreicher Versorgung nach der Befruchtung abdecken28,29. Das Platyfisch-Genom ist das erste eines lebendgebärenden Wirbeltiers, das kein Säugetier ist. Wir analysierten bei Platyfischen sowie bei einem zweiten lebendgebärenden Fisch, dem Schwertträger Xiphophorus hellerii, die beide vor der Befruchtung gut mit Eiern versorgt sind30,31, drei Gruppen von Viviparitätsgenen (Dotter-, Plazenta- und Eihüllengene; n = 34) auf Genverlust und positive Selektion im Vergleich zu vier Arten eierlegender Teleosteer (Medaka, Tetraodon, Stichling und Zebrafisch).
Bei Säugetieren wurde vorgeschlagen, dass die Entstehung der Viviparie mit dem fortschreitenden Verlust der Vitellogenine (Dottervorläufer) einhergeht32. Bei Platyfish und Schwertträger waren alle mit dem Dotter zusammenhängenden Gene (Vitellogenine und ihre Transporter/Rezeptoren; ergänzende Tabelle 5) vorhanden und entwickelten sich unter reinigender Selektion, was damit übereinstimmt, dass beide Arten die Eier vor der Befruchtung vollständig versorgen, mit Ausnahme eines Gens, das sich unter positiver Selektion entwickelte, Vitellogenin1 (ergänzende Abb. 5a).
Drei von 13 Platyfischgenen, deren Säugetierorthologe mit der Plazentaentwicklung zusammenhängen, entwickelten sich unter positiver Selektion (Abb. 4a, ergänzende Abb. 5b-d und ergänzende Tabelle 5). Igf2, das in der Maus die Durchlässigkeit der Plazenta reguliert33, entwickelte sich unter starker positiver Selektion in Platyfish (Abb. 4a), die insbesondere die Region distal der Proteolyse-Stelle betraf. Die igf2-Sequenz33 war auch von einem anderen Poeciliiden, dem Wüstenhahn Poeciliopsis lucida, verfügbar, der einen lebendgebärenden Vorfahren mit Xiphophorus-Arten teilt, sich aber dadurch unterscheidet, dass sich die Plazentation erst kürzlich entwickelt hat. Beim Wüstenhund entwickelte sich dieselbe Region wie beim Platyfish unter positiver Selektion, aber die Selektion war sogar noch stärker (ergänzende Abb. 5b), was auf eine fortlaufende molekulare adaptive Evolution seit der Trennung der beiden Gattungen, die diese Fische enthalten, vor mehreren Millionen Jahren hindeutet. Die beiden anderen Plazenta-Gene, pparg und ncoa6, wiesen mehrere Regionen mit Signalen für positive Selektion außerhalb bekannter Funktionsbereiche auf, was auf neuartige, für die Viviparität wichtige Regionen schließen lässt. Dieselben Gene, die bei lebendgebärenden Fischen unter Selektion stehen, zeigten jedoch keine positiven Selektionssignaturen, wenn orthologe Gene vom eierlegenden Schnabeltier sowie von Beuteltieren und plazentaren Säugetieren analysiert wurden (ergänzende Tabelle 6). Dieses Ergebnis steht im Einklang mit der Tatsache, dass die Plazenten von Säugetieren und Fischen konvergente, aber nicht homologe Strukturen sind.
Die Gene der Zona pellucida (Zpc), die eine glykoproteinreiche Hülle produzieren, die die Plasmamembran der Eizelle umgibt, wiesen die ausgeprägtesten Veränderungen auf. alveolin wurde aus dem Platyfish-Genom entfernt. Im Gegensatz dazu entwickelten sich ChoriogeninH minor, ChoriolysinL, ChoriolysinH und zvep unter positiver Selektion (Abb. 4b, ergänzende Abb. 5e-g und ergänzende Tabelle 5). In Xenopus laevis steuern die Zpc-Gene die artspezifische Spermienbindung und tragen dazu bei, dass nur artgleiche Spermien, die in die wässrige Umgebung abgegeben werden, die Eier befruchten34. Bei lebendgebärenden Fischen findet die Befruchtung jedoch intern statt, so dass die Erkennung artspezifischer Spermien nicht so wichtig ist. Im Vergleich zu eierlegenden Fischen dürfte sich die Eischale bei diesen Fischen an die Entwicklung im Inneren des Muttertieres angepasst haben, da sie nicht mehr für den Schutz notwendig ist, sondern den Gas- und Materialaustausch erleichtern muss. Die Enzymgene zvep und choriolysinH wiesen schnell wachsende Stellen auf, die sich im Allgemeinen in der Nähe der katalytischen Domänen befanden (ergänzende Abb. 4f,g), was darauf hindeutet, dass diese Enzyme während der Evolution der Viviparität möglicherweise veränderte Interaktionen mit Ziel- oder Regulierungsproteinen hatten. Bemerkenswert ist, dass sich in ChoriogeninH minor dieselben Regionen, insbesondere in der Zona pellucida-Domäne, unter positiver Selektion sowohl bei Säugetieren als auch bei Fischen entwickelt haben (Abb. 4b). Dies ist ein bemerkenswertes Beispiel dafür, wie sich konvergente Evolution auf molekularer Ebene auf der physiologischen und letztlich morphologischen Ebene manifestiert.
Unsere Analysen der Folgen von TGD haben eine funktionelle Klasse von Genen aufgedeckt, die unser Interesse geweckt hat, weil Xiphophorus-Fische im Besonderen und Teleoste im Allgemeinen ein ausgesprochen hohes Maß an Verhaltenskomplexität35 aufweisen, das andere Gruppen von „kaltblütigen“ Wirbeltieren wie Amphibien und Reptilien nicht erreichen. Anhand des Platyfisch-Genoms und der Genannotationen von sechs anderen sequenzierten Teleostierarten fragten wir, ob die doppelte Genretention aus dem TGD-Ereignis durch Subfunktionalisierung (differenzielle Beibehaltung von Unterfunktionen der Vorfahren) und/oder Neofunktionalisierung (Erwerb neuer Unterfunktionen)36 den Erwerb komplexerer Verhaltensweisen bewirken könnte. Wir verglichen 190 kognitionsbezogene Gene (ergänzende Tabelle 7 und ergänzende Anmerkung) mit jenen, die an der Pigmentierung (133 Gene, für die ein größeres Genrepertoire mit der hohen Komplexität und Vielfalt der Teleost-Färbung in Verbindung gebracht wurde) und den Leberfunktionen (187 Gene)18 als Kontrollen beteiligt sind. Die Analyse der Gene, die mit der Wahrnehmung zusammenhängen, ergab eine hohe Rate der doppelten Beibehaltung von 45 % bei Platyfischen und ähnliche Werte bei anderen Teleosteern (Abb. 5 und ergänzende Abb. 6), verglichen mit den Raten für Gene, die mit der Pigmentierung (30 %) und der Leberfunktion (15 %) zusammenhängen. Die durchschnittliche Rate der doppelten Beibehaltung aller Gene in Teleost-Genomen wird auf 12-24 % geschätzt (Ref. 37). Wir fanden keine Verzerrung bei Genen aus allen drei Funktionskategorien (Wahrnehmung, Pigmentierung und Leberfunktion), die nach TGD aufgrund von Dosisempfindlichkeit oder Zugehörigkeit zu Proteinkomplexen beibehalten wurden (ergänzende Tabellen 8 und 9 und ergänzende Anmerkung), aber es wurde eine Verzerrung bei den Wahrnehmungsgenen (aber nicht bei den Leberfunktions- und Pigmentierungsgenen) für besonders große Proteine (>1.000 Aminosäuren lang) festgestellt (ergänzende Abb. 7, ergänzende Tabelle 10 und ergänzende Anmerkung). Die Darstellung der Genverluste auf dem phylogenetischen Baum zeigte, dass die Beibehaltung der Wahrnehmungsgene bereits kurz nach dem TGD und vor der Diversifizierung der Teleosteer festgelegt wurde. Dieser Befund stützt die Hypothese, dass die Retention von Paralogen aus dem TGD-Ereignis das hohe Maß an Verhaltenskomplexität bei Xiphophorus und anderen Teleosten unterstützt haben könnte.
Die Genomsequenz und -analyse des Platyfisches haben neue Perspektiven für mehrere herausragende Merkmale dieses Fischmodells eröffnet, darunter seine lebendgebärende Fortpflanzungsweise, Variationen in den Pigmentierungsmustern, die Evolution der Geschlechtschromosomen in Aktion, komplexes Verhalten und sowohl spontane als auch induzierte Karzinogenese17. Teleosteer dominieren die heutige Fischfauna, und innerhalb der Teleosteer (Abb. 1b) ist die Familie der Poeciliidae, zu der Platyfische, Schwertträger, Guppys und Mollys gehören, ein Musterbeispiel für dieses breite Spektrum an Anpassungen. Unsere Studie dieses ersten Genoms eines Poeciliidenfisches beleuchtet einige evolutionäre Anpassungen der Teleosteer und stellt eine wichtige Ressource für die Untersuchung von Melanomen und anderen segregierenden Phänotypen dar.