Articles

El genoma del pez látigo, Xiphophorus maculatus, proporciona información sobre la adaptación evolutiva y varios rasgos complejos

Secuenciamos el genoma completo de una sola hembra de pez látigo (XX, 2n = 46 cromosomas, cepa Jp163A; Fig. 1) de la generación 104 de apareamientos continuos entre hermanos. La cobertura total de la secuencia de 19,6 veces (Nota Suplementaria) produjo un ensamblaje con longitudes N50 de contig y supercontig de 22 kb y 1,1 Mb, respectivamente (Tabla Suplementaria 1). Los errores de ensamblaje, en su mayoría inserciones o supresiones de un solo nucleótido, se corrigieron con lecturas de extremo pareado de Illumina. Se ensambló un total de 669 Mb de la longitud estimada del genoma de 750-950 Mb en contigs. Las predicciones genéticas identificaron 20.366 genes codificantes, 348 genes no codificantes y 28 pseudogenes (Nota Suplementaria).

Figura 1: El pez platy, X. maculatus.
figure1

(a) Pez platino hembra (arriba) y macho (abajo), de la cepa Jp163A con manchas de pigmento negro en la aleta dorsal que se desarrollan cuando se controla adecuadamente la actividad de un oncogén del cromosoma X. En los genotipos híbridos, este control se ve comprometido y se desarrolla un melanoma maligno a partir de las manchas. (b) Posición filogenética del pez látigo en relación con otras especies de peces.

Al igual que en otros teleósteos, los elementos transponibles (TEs) en el pez látigo eran muy diversos, incluyendo muchas familias ausentes en mamíferos1 y aves (Figs. Suplementarias 1-3, Tablas Suplementarias 2 y 3 y Nota Suplementaria). Descubrimos que el 4,8% del transcriptoma procedía de secuencias de TE que representaban unas 40 familias diferentes, lo que indica que es muy probable que muchos de los TE de los peces platino sigan activos. Los TEs más activos fueron los transposones de ADN Tc1 (>16.000 copias), seguidos por la familia RTE (>9.000 copias). En particular, identificamos varias copias casi intactas que codifican la envoltura de un retrovirus espumoso (Spumaviridae) integrado en el genoma del pez platino (Fig. 2). Los virus espumosos son conocidos como agentes infecciosos exógenos en mamíferos2. Sólo recientemente se han descrito secuencias endógenas de virus espumosos que pueden representar un registro fósil de infecciones en los genomas del perezoso3 y del aye-aye4 en mamíferos y en el celacanto5. Una secuencia similar a la del virus espumoso en el pez cebra6, una secuencia en el bacalao descubierta durante este trabajo y la secuencia del genoma del pez platino que se presenta aquí muestran un espectro aún más amplio de huéspedes. La filogenia molecular de los virus espumosos es coherente con la filogenia de los huéspedes (Fig. 2). Este resultado apoya la noción de un antiguo origen evolutivo marino de este tipo de virus, con una posible coevolución huésped-virus5. Las copias casi intactas del virus espumoso encontradas en los genomas de algunas especies de peces divergentes, ausentes de otros genomas de peces secuenciados, podrían indicar introducciones independientes en la línea germinal a través de la infección. El virus espumoso exógeno no se había descrito en los peces; sin embargo, nuestros resultados sugieren que los virus espumosos exógenos han sido y podrían seguir siendo infecciosos en el linaje de los peces.

Figura 2: Árbol filogenético de los retrovirus endógenos basado en las secuencias de la proteína transcriptasa inversa.
figure2

Las secuencias del virus espumoso (FV) (sombreado en azul claro) forman dos grupos filogenéticos distintos, uno específico para tetrápodos y otro para teleósteos. Ambos grupos contienen secuencias endógenas del virus espumoso (EFV) (las secuencias del pez látigo y del bacalao, identificadas recientemente, están resaltadas con un sombreado azul oscuro). El alineamiento se realizó con ClustalW (223 aminoácidos), y el árbol filogenético se construyó con el paquete PhyML utilizando métodos de máxima verosimilitud38 con bootstrap por defecto (mostrado al principio de las ramas) y opciones de cálculo optimizadas. FV, virus espumoso; MuERV-L, retrovirus endógeno de Mus musculus-L; BAEV, virus endógeno del babuino; FENV1, virus endógeno felino 1; EFV, virus espumoso endógeno, MLV, virus de la leucemia murina; HERV-K, retrovirus endógeno humano-K; MMTV, virus del tumor mamario del ratón; VIH-1, virus de la inmunodeficiencia humana-1. La barra de escala representa el número de sustituciones por sitio.

Los mapas de homología cromosómica de los mamíferos muestran una disposición en forma de mosaico de unos 35 grandes bloques de sintenia conservados de media (pero unos 80 en el perro y 200 en el ratón) y numerosos bloques pequeños ensamblados en diferentes combinaciones entre las distintas especies y que abarcan más de 90 millones de años de evolución7. Construimos el mapa genético meiótico más extenso para cualquier vertebrado que se haya publicado hasta ahora, lo que permitió ordenar los andamios de X. maculatus y realizar un análisis preciso de la sintenia conservada comparando los genomas de los peces (Nota suplementaria). Utilizamos el innovador enfoque del ADN asociado a sitios de restricción (RAD)8 para construir un mapa meiótico que consta de 16.245 marcadores polimórficos que definen 24 grupos de enlace equivalentes al número de cromosomas haploides del pez platino9. Así, se pudo asignar una posición cromosómica al 90,17% del total de las secuencias de los contigs. Las comparaciones de largo alcance del orden de los genes entre especies10 identificaron nuevas relaciones evolutivas entre el pez platino y otros cromosomas de teleósteos. El Medaka, el pariente más cercano con un genoma secuenciado, también tiene 24 cromosomas, y 19 de ellos mostraron una relación estricta de uno a uno con los cromosomas del pez látigo (Fig. 3a,b). Los cinco cromosomas restantes del pez platío eran también cada uno de ellos ortólogos de un solo cromosoma del medaka, con la excepción de uno o dos segmentos cortos (∼1 Mb de longitud) que se encontraban en otro cromosoma del medaka (Fig. 3c y Fig. 4 suplementaria). Así pues, bastantes translocaciones, todas ellas muy cortas, han alterado los cariotipos desde la divergencia del medaka y el pez látigo hace 120 millones de años11,12. Una imagen similar surgió de las comparaciones de los cromosomas del pez platino con los del espinoso (divergencia hace 180 millones de años)11,12. Estos hallazgos detallan el amplio grado de conservación del contenido genético de los cromosomas de estos teleósteos a lo largo de casi 200 millones de años de evolución, una conservación mucho mayor que la encontrada en los mamíferos durante aproximadamente la mitad de ese tiempo7,11,12. Esto es algo inesperado, dado el acontecimiento de la duplicación del genoma de los teleósteos (TGD), porque se podría haber pensado que el emparejamiento ilegítimo de cromosomas paralógicos (que surge de la TGD) podría haber facilitado las translocaciones. Los mecanismos que pueden haber mitigado dichas translocaciones siguen siendo desconocidos.

Figura 3: Sintenias conservadas entre el pez platy y el medaka.
figure3

(a) Los ortólogos del medaka de los genes del cromosoma 9 de X. maculatus (Xma9) tienden a estar en el cromosoma 4 de Oryzias latipes (Ola4), lo que demuestra que el contenido genético de estos cromosomas ha permanecido intacto sin translocaciones en los 120 millones de años transcurridos desde que los linajes de estas especies divergieron. Cada punto gris a lo largo del eje horizontal etiquetado como Xma9 representa la posición de un gen de pez platino cuyo ortólogo de medaka (según el análisis recíproco del mejor resultado de BLAST) se encuentra directamente vertical al gen Xma9, trazado en el cromosoma de medaka correspondiente10. (b) Recíprocamente, casi todos los ortólogos del pez plateado de los genes del cromosoma Ola4 de medaka se encuentran en Xma9. (c) Casi todos los ortólogos de medaka de Xma19 se encuentran en Ola22, excepto un segmento de aproximadamente 1 Mb de longitud en la posición 20 Mb de Ola22 que aparece en Ola24 (recuadro punteado).

El pez platy es un modelo bien conocido en la investigación del cáncer13. Su genoma contiene una región de control tumoral (TCR), que incluye el oncogén xmrk14 que desencadena el desarrollo del melanoma. El TCR también contiene el modificador tumoral mdl15,16. Las variantes alélicas de mdl controlan el compartimento corporal, el momento de aparición y la gravedad de los tumores17. Además, los alelos mdl se manifiestan en el pez platino como una gran diversidad de patrones de pigmentación genéticamente definidos. El genoma mapeado nos permitió descartar muchos genes de pigmento como factores responsables de estas variantes de pigmento asociadas al sexo y modificadoras del melanoma. Todos los genes pigmentarios conocidos18 estaban presentes en el genoma de las hembras de pez látigo XX; por tanto, ninguno es específico del cromosoma Y. Sólo 6 de los 174 genes pigmentarios conocidos (asip2a, egfrb, muted, myca, rps20 y tfap2a) estaban localizados en el cromosoma X (Xma21). De estos seis, sólo el protooncogén egfrb residía lo suficientemente cerca del oncogén del melanoma xmrk (Tabla Suplementaria 4) como para ser considerado un gen candidato para la mdl. De hecho, los estudios bioquímicos han demostrado que Egfrb puede cooperar con Xmrk19, pero los niveles de expresión de estos genes están regulados de forma inversa en el melanoma20. Se necesitan más estudios para evaluar la función de egfrb y para encontrar otros candidatos a genes de pigmentación no clásicos en esta región genómica que puedan controlar tanto el patrón de pigmentación como el fenotipo del melanoma.

Otro componente genético hasta ahora no identificado del modelo de melanoma de Xiphophorus es el gen R/Diff. R/Diff suprime la formación de melanomas en los peces platillo salvajes, y la eliminación de su expresión por hibridación interespecífica permite el crecimiento del tumor. R/Diff fue mapeado en un intervalo de 10-cM en Xma5 cerca del locus cdkn2a/b21. A pesar de que el gen CDKN2A humano ortólogo es un gen supresor de tumores bien descrito en ciertos melanomas humanos22, cdkn2a/b fue excluido de ser R/Diff porque no está mutado sino que está sobreexpresado en el modelo de melanoma Xiphophorus23. La secuencia Xma5 define ahora una serie de genes candidatos a R/Diff para su posterior exploración. Por ejemplo, el andamio 182 (1.085.500 pb), que alberga cdkn2a/b, contiene varios genes con alto potencial de tener un papel como supresor tumoral R/Diff (por ejemplo, tet2, cxxc4, mtap, topo-rs, mdx4 y pdcd4a). Alternativamente, la región puede representar un locus complejo que comprende varios genes que actúan de forma sinérgica o compensatoria para regular el oncogén xmrk, en consonancia con informes anteriores de carcinogénesis espontánea e inducida en los numerosos modelos tumorales híbridos de Xiphophorus entre especies24,25,26.

La viviparidad es un modo reproductivo elaborado que implica diversos niveles de inversión materna en la descendencia, que van desde el aprovisionamiento completo de los huevos antes de la fecundación y su retención durante el desarrollo hasta el aprovisionamiento mínimo de los huevos antes de la fecundación y el aprovisionamiento después de la fecundación a través de una placenta, como en los mamíferos. La familia de peces Poeciliidae, un clado monofilético de más de 260 especies27, es inusual al incluir especies que abarcan el espectro desde un aprovisionamiento insignificante hasta uno extenso después de la fertilización28,29. El genoma del pez látigo es el primero de un vertebrado vivíparo no mamífero. Realizamos un análisis en el pez platy, así como en un segundo pez vivíparo, el Xiphophorus hellerii, ambos con huevos bien aprovisionados antes de la fecundación30,31, de 3 grupos de genes de viviparidad (genes de la yema, de la placenta y de la cubierta del huevo; n = 34) para la pérdida de genes y la selección positiva en comparación con 4 especies de teleósteos que ponen huevos (medaka, tetraodon, stickleback y pez cebra).

En los mamíferos, se ha propuesto que el aumento de la viviparidad implica la pérdida progresiva de vitelogeninas (precursores del vitelo)32. En el pez platino y la cola de espada, todos los genes relacionados con el vitelo (vitelogeninas y sus transportadores/receptores; Tabla Suplementaria 5) estaban presentes y evolucionaron bajo selección purificadora, lo que concuerda con que ambas especies aprovisionan completamente los huevos antes de la fecundación, con la excepción de un gen que evolucionó bajo selección positiva, la vitelogenina1 (Fig. Suplementaria 5a). 5a).

Tres de los 13 genes del pez látigo, cuyos ortólogos en mamíferos están relacionados con el desarrollo de la placenta, evolucionaron bajo selección positiva (Fig. 4a, Fig. Suplementaria 5b-d y Tabla Suplementaria 5). Igf2, que en el ratón regula la permeabilidad de la placenta33, evolucionó bajo una fuerte selección positiva en el pez látigo (Fig. 4a), que afectó particularmente a la región distal al sitio de proteólisis. La secuencia de igf233 también estaba disponible en otro poecilido, el pececillo del desierto Poeciliopsis lucida, que comparte un ancestro de vida con las especies de Xiphophorus pero difiere en haber evolucionado la placentación recientemente. En el pececillo del desierto, la misma región que en el pez látigo evolucionó bajo selección positiva, pero la selección fue aún más fuerte (Fig. 5b suplementaria), lo que sugiere una evolución adaptativa molecular en curso desde que los dos géneros que contienen estos peces divergieron hace varios millones de años. Los otros dos genes placentarios, pparg y ncoa6, tenían múltiples regiones con señales de selección positiva fuera de los dominios funcionales conocidos, lo que sugiere nuevas regiones importantes para la viviparidad. Los mismos genes bajo selección en los peces vivíparos, sin embargo, no mostraron señales de selección positiva cuando se analizaron los genes ortólogos del ornitorrinco que pone huevos y de los marsupiales y mamíferos placentarios (Tabla Suplementaria 6). Este resultado está en consonancia con el hecho de que las placentas de los mamíferos y de los peces son estructuras convergentes pero no homólogas.

Figura 4: Probabilidades posteriores para las clases de sitios bajo modelos alternativos a lo largo del gen para cada sitio de aminoácidos calculado por el análisis empírico de Bayes.
figure4

Los sitios de clase 1 están bajo selección purificadora (relación Ka/Ks de ∼0), los de clase 2 están bajo selección neutra (relación Ka/Ks de ∼1), y los de clase 3 están bajo selección positiva en las especies de Xiphophorus. (a) Factor de crecimiento similar a la insulina 2 (IGF2). Las barras coloreadas bajo el gráfico muestran los dominios funcionales conocidos, y la flecha muestra el sitio de proteólisis (entre los residuos 118 y 119). (b) CoriogeninaH menor. Arriba, comparación de los peces que ponen huevos con los que están vivos. Abajo, comparación entre mamíferos placentarios y no placentarios. Las mismas regiones están bajo selección positiva en peces y mamíferos.

Los genes de la zona pelúcida (Zpc), que producen una capa rica en glicoproteínas que rodea la membrana plasmática del ovocito, mostraron los cambios más pronunciados. Por el contrario, la coriogeninaH menor, la corioolisinaL, la corioolisinaH y zvep evolucionaron bajo selección positiva (Fig. 4b, Fig. suplementaria 5e-g y Tabla suplementaria 5). En Xenopus laevis, los genes Zpc controlan la unión de los espermatozoides específicos de la especie y ayudan a garantizar que sólo los espermatozoides coespecíficos liberados en el medio acuoso fecunden los huevos34. Los peces vivíparos, sin embargo, tienen una fertilización interna, en la que el reconocimiento del esperma específico de la especie no sería tan crucial. En comparación con los peces que ponen huevos, se espera que la cáscara del huevo en estos peces se haya adaptado al desarrollo dentro de la madre, ya que ya no es esencial para la protección sino que debe facilitar el intercambio de gases y materiales. Los genes de las enzimas de eclosión zvep y choriolysinH mostraron sitios de rápida evolución situados generalmente adyacentes a los dominios catalíticos (Fig. Suplementaria 4f,g), lo que indica que, durante la evolución de la viviparidad, estas enzimas podrían haber alterado las interacciones con las proteínas diana o reguladoras. En particular, en la coriogeninaH menor, las mismas regiones, en particular en el dominio de la zona pelúcida, evolucionaron bajo selección positiva tanto en mamíferos como en peces (Fig. 4b). Este es un ejemplo notable de cómo la evolución convergente a nivel molecular se manifiesta a nivel fisiológico y, en última instancia, morfológico.

Nuestros análisis de las consecuencias de la TGD descubrieron una clase funcional de genes que suscitaron nuestro interés porque los peces Xiphophorus, en particular, y los teleósteos, en general, muestran un alto nivel de complejidad conductual35 que otros grupos de vertebrados de sangre fría, como los anfibios y los reptiles, no alcanzan. Utilizando el genoma del pez látigo y las anotaciones genéticas de otros seis teleósteos secuenciados, nos preguntamos si la retención de genes duplicados del evento TGD podría producir a través de la subfuncionalización (retención diferencial de subfunciones ancestrales) y/o neofuncionalización (adquisición de nuevas subfunciones)36 la adquisición de comportamientos más complejos. Comparamos 190 genes relacionados con la cognición (Tabla Suplementaria 7 y Nota Suplementaria) con los implicados en la pigmentación (133 genes, cuyos repertorios génicos aumentados se han relacionado con la alta complejidad y diversidad de la coloración de los teleósteos) y las funciones hepáticas (187 genes)18 como controles. El análisis de los genes relacionados con la cognición mostró una alta tasa de retención de duplicados del 45% en el pez platino y valores similares en otros teleósteos (Fig. 5 y Fig. 6 suplementaria) en comparación con las tasas observadas para los genes relacionados con la pigmentación (30%) y la función hepática (15%). La tasa media de retención de duplicados en todos los genes de los genomas de teleósteos se estima en un 12-24% (ref. 37). No encontramos ningún sesgo en los genes de las tres categorías funcionales (cognición, pigmentación y función hepática) que fueron retenidos tras la TGD debido a la sensibilidad a la dosis o a la pertenencia a un complejo proteico (Tablas Suplementarias 8 y 9 y Nota Suplementaria), pero sí se encontró un sesgo en los genes de la cognición (pero no en los de la función hepática y la pigmentación) para las proteínas particularmente grandes (>1.000 aminoácidos de longitud) (Fig. Suplementaria 7, Tabla Suplementaria 10 y Nota Suplementaria). El trazado de las pérdidas de genes en el árbol filogenético mostró que la retención de genes de cognición ya estaba fijada poco después de la TGD y antes de la diversificación de los teleósteos. Este hallazgo apoya la hipótesis de que la retención de paralogos desde el evento TGD puede haber apoyado el alto nivel de complejidad del comportamiento en Xiphophorus y otros teleósteos.

Figura 5: Retención diferencial de duplicados de genes en la cognición, la pigmentación y las clases funcionales del hígado en los teleósteos después de TGD.
figure5

(a) Tasas de retención de duplicados derivados de TGD de genes relacionados con la cognición, la pigmentación y la función hepática en siete genomas de teleósteos. Los puntos temporales durante la evolución de los teleósteos que implican el linaje que conduce a Xiphophorus están conectados por líneas. (b) Mapa filogenético de las pérdidas de genes para 190 pares de duplicados de genes relacionados con la cognición tras el TGD. Las pérdidas se indican con valores negativos. El número de pares de paralogos TGD retenidos para cada genoma individual de teleósteos se indica entre paréntesis. Las pérdidas de paralogos de TGD se han asignado a la filogenia de teleósteos proporcionada por Setiamarga et al.39 siguiendo el principio de parsimonia. El evento TGD se fijó en 350 millones de años. La tasa de retención de los paralogos TGD se define por el número de pares de duplicados derivados de TGD presentes en un linaje específico dividido por el número de pares de duplicados derivados de TGD presentes en el momento de TGD18.

La secuencia y el análisis del genoma del pez platy han proporcionado nuevas perspectivas para varias características prominentes de este modelo de pez, incluyendo su modo de reproducción en vivo, la variación en los patrones de pigmentación, la evolución del cromosoma sexual en acción, el comportamiento complejo y la carcinogénesis tanto espontánea como inducida17. Los teleósteos dominan la fauna piscícola existente y, dentro de los teleósteos (Fig. 1b), la familia Poeciliidae, que incluye a los peces platy, los colas de espada, los guppies y los mollies, es un paradigma de este amplio espectro de adaptaciones. Nuestro estudio de este primer genoma de un pez poecilio ilumina algunas adaptaciones evolutivas de los teleósteos y proporciona un importante recurso para avanzar en el estudio del melanoma y otros fenotipos segregantes.