Una nueva mirada a una vieja pregunta: ¿cuándo se produjo la segunda duplicación del genoma completo en la evolución de los vertebrados?
Para salvar la gran distancia evolutiva entre los vertebrados actuales y el cordado ancestral con un genoma no duplicado, Sacerdot y sus colegas reconstruyeron primero el genoma ancestral de los amniotas. Para ello, primero aplicaron el algoritmo AGORA (Algorithm for Gene order Reconstruction in Ancestors) que habían desarrollado previamente a los órdenes, orientaciones y árboles de genes de 61 genomas de animales actuales de la base de datos Ensembl. Estos incluían 40 mamíferos, 3 aves, 2 reptiles, 1 anfibio, 8 teleósteos, 1 celacanto, 2 tunicados, 1 nematodo y 1 mosca. Por desgracia, Ensembl no incluye el genoma de ningún pez cartilaginoso (por ejemplo, el tiburón elefante, Callorhinchus milii, un quimera, que tiene el genoma de vertebrados de evolución más lenta que se conoce), ni los de hemicordados, equinodermos o cefalocordados, deuteróstomos invertebrados cuyos genomas no han sufrido la considerable pérdida y compactación de genes que caracteriza a los genomas de los tunicados.
Sacerdot et al. identificaron entonces los pares de genes ohnológicos putativos en este genoma ancestral de amniotas y produjeron conjuntos de Regiones Ancestrales Contiguas (CARs). Los ohnologs son genes homólogos dentro de una especie que resultan de WGDs. Finalmente, agruparon estas CARs en un conjunto de 51 que cayeron significativamente en 17 grupos de cuatro, o tétradas; el resultado esperado de dos rondas de WGD. Para distinguir el patrón de fusiones y fisiones cromosómicas durante la evolución, querían comparar estas 17 tétradas con la organización de los genes en un genoma de prevertebrados no duplicado. Sin embargo, los genomas de los tunicados evolucionan muy rápidamente y son bastante divergentes de los de otros deuteróstomos invertebrados, mientras que el ensamblaje del genoma publicado del cefalocordado Branchiostoma floridae está demasiado fragmentado para el análisis. Por lo tanto, los autores compararon sus 17 tétradas de CARs con los 17 grupos de enlace ancestrales de cordados determinados previamente por comparación de la sintenia de genes en los cromosomas humanos y en los andamios del genoma de B. floridae. Sorprendentemente, cada uno de estos grupos de ligamiento de cordados se correlacionaba con una tétrada CAR predominante. De esta comparación concluyeron que el genoma del vertebrado ancestral tenía 17 cromosomas que luego se duplicaron en 34 cromosomas a través de una ronda de WGD (1R). Posteriormente, se produjeron 7 fusiones cromosómicas que dieron lugar a 27 cromosomas, que en el origen de los vertebrados, antes de la división agnato/gnato, se duplicaron de nuevo (2R WGD) en 54 cromosomas. Después de la 2R WGD, hubo cuatro fusiones adicionales antes del vertebrado óseo ancestral, seguidas de una quinta fusión antes de la base de los amniotas. Así, el cariotipo ancestral de los vertebrados óseos incluía 50 cromosomas y el amniote ancestral tenía 49 cromosomas (Fig. 1b).
Además de reconstruir las duplicaciones, fusiones y fusiones de cromosomas durante la evolución, el algoritmo AGORA puede calcular los órdenes de los genes en los cromosomas del hipotético ancestro amniote comparando los órdenes de los genes en los cromosomas de sus descendientes actuales . Este genoma ancestral reconstruido de los amniotas contiene el 80% de los 15.854 genes de los CAR. La desigual distribución de estos genes en los 49 cromosomas del amniote ancestral podría reflejar la realidad o, alternativamente, la dificultad de reconstruir el orden de los genes en cromosomas que han sufrido una considerable reordenación génica durante la evolución.
Aún así, dos cosas destacan en el análisis. La primera es que la comparación del genoma ancestral de los amniotas con los CARs agrupados en 17 tétradas con los superesquemas del ensamblaje del genoma de la lamprea (Petromyzon marinus) muestra un claro patrón de 1 a 4 consistente con el WGD de 2R antes de la división agnato/gnatostoma. Esto no concuerda con los resultados de Smith et al. que encontraron fuertes evidencias de una DGA de 1R en la lamprea en comparación con el pollo. Esta discrepancia podría explicarse por la inclusión de datos genómicos de más especies a la hora de reconstruir el hipotético genoma ancestral de los amniotas, un proceso que en sí mismo también elimina los reordenamientos genómicos confusos que se han producido en los vertebrados con posterioridad al ancestro amniotas. Es probable que también se deba a la inclusión de datos filogenéticos para determinar las tétradas CAR, revelando así los ohnologs que divergieron en la base de la evolución de los vertebrados.
El segundo resultado que destaca es la correspondencia entre el orden de los genes en los cromosomas humanos y los 17 cromosomas pre-1R. Cuando los 17 cromosomas pre-1R se codifican por colores (Fig. 1b) y los colores de cada gen se transfieren a las posiciones de los 8282 genes humanos que descienden de los genes pre-1R, el patrón de duplicaciones y translocaciones del genoma es evidente. Por ejemplo, el cromosoma 1 del genoma pre-1R contiene genes Hox. Un gran segmento del cromosoma 2 humano contiene el clúster HoxD, además de muchos otros genes correspondientes a los del cromosoma 1 pre-1R. Los otros tres grupos Hox humanos se encuentran en los cromosomas humanos 7, 12 y 17. Además, un número considerable de homólogos de otros genes del cromosoma 1 pre-1R se encuentran en los cromosomas humanos 1, 3, 10, 16 y 22, lo que indica la existencia de translocaciones.