Draft:Limitación evolutiva e innovación en cientos de mamíferos placentarios mamíferos placentarios

From Wikipedia, the free encyclopedia

Los mamíferos placentarios, son un grupo diverso y amplio de mamíferos que constituyen la mayoría de las especies de mamíferos en la Tierra, que incluyen a los humanos, con más de 6100 especies existentes.

Zoonomia es la base de datos de genómica comparativa más extensa para mamíferos hasta la fecha, con genomas completos alineados para 240 especies diversas y secuencias de genes codificadores de proteínas alineadas para 427 especies. Este recurso nos permite identificar elementos conservados en los genomas de todos los mamíferos placentarios, elementos que cambian inusualmente rápido en linajes específicos y elementos asociados con rasgos particulares. Estos tres enfoques abordan un desafío clave en genómica: identificar elementos genómicos que afectan la función del genoma y los fenotipos del organismo.

En el genoma humano, al menos 332 millones de bases muestran un nivel inusual de conservación entre especies, indicando restricción evolutiva. Mientras que 4552 elementos ultraconservador presentan una conservación casi perfecta. Al comparar genomas de diversas especies, podemos evaluar si las mutaciones en posiciones específicas se retienen más o menos frecuentemente de lo esperado bajo la deriva neutral. Menos diferencias de las esperadas sugieren restricción evolutiva (limitada variación debido a la selección purificadora o conservación), mientras que más diferencias en ciertas líneas evolutivas sugieren aceleración. Estas medidas se mantienen consistentes en diferentes tipos celulares y etapas del desarrollo, simplificando la recolección de muestras y la generación de datos. La restricción evolutiva es una herramienta valiosa para identificar variantes genómicas vinculadas causalmente a enfermedades humanas.

Restricciones y Aceleraciones en la Evolución de Mamíferos[edit]

Se seleccionaron especies para incorporar en Zoonomia con el objetivo de maximizar la longitud de las ramas evolutivas representadas y, de esta manera, aumentar la capacidad para detectar restricciones evolutivas. La alineación actualizada de Cactus sin referencia, que abarca 241 especies con 240 (el perro doméstico tiene dos representantes), supera las limitaciones de las alineaciones basadas en referencia. A partir de esto se pudo observar que 3.6 millones de sitios perfectamente conservados. Se midió la restricción evolutiva en los genomas de referencia humano, chimpancé, ratón, perro y murciélago marrón pequeño proyectando la alineación Cactus en cada especie y midiendo la restricción de secuencia con phyloP. En la alineación referenciada a humanos, el 91% del genoma humano se alinea con al menos cinco especies, pero solo el 11% se alinea con ≥95% de las especies. En elementos altamente conservados, la mayoría de las bases se alinean en la mayoría de las especies, incluso en especies distantes. En elementos que evolucionan activamente, la mayoría de las especies tienen una alineación parcial con los humanos. Los elementos específicos de primates se alinean excepcionalmente bien solo en un pequeño número de especies. Los elementos similares a promotores y potenciadores tienden a ser altamente conservados. Los elementos que se unen específicamente al factor de transcripción CTCF o están marcados por H3K4me3 (histona H3 lisina 4 trimetilada) tienen más probabilidades de evolucionar activamente, y aproximadamente el 20% son específicos de primates.

Aproximación de la restricción en todo el genoma[edit]

En relación al genoma humano, se estimó que un mínimo de 332 Mb (10.7%) del este se encuentra bajo restricción evolutiva a través de la selección purificadora. En relación a especies como chimpancés, ratones, perros y murciélagos las restricciones evolutivas varían desde 239 Mb en el ratón (9.0%) hasta 359 Mb en el chimpancé (11.8%). Esto sugiere que la cantidad del genoma bajo restricción detectable en ratones, perros y murciélagos aumentará a medida que se agreguen más especies a la alineación.

Genes con mayor presencia de restricción y aceleración[edit]

Los genes con secuencias de codificación de proteínas altamente restringidas están enriquecidos en procesos biológicos que funcionan de manera similar entre especies, mientras que aquellos que están cambiando más rápidamente están enriquecidos en procesos que varían entre especies. Se analizaron los genes más acelerados y más conservados (ubicados en el 5% superior según el puntaje promedio de phyloP de la secuencia de codificación), frente a un conjunto representativo no redundante de procesos biológicos de la Gene Ontology (GO) utilizando WebGestalt, e identificamos conjuntos de genes sobrerrepresentados. Los genes más restringidos están involucrados en la regulación post-transcripcional de la expresión génica, y el procesamiento de ARN es esencial para regular las respuestas celulares a los cambios ambientales, siendo las fallas capaces de causar enfermedades debilitantes.

Uno de estos genes puede ser el gen CMAH este se encuentra inactivado en humanos debido a una eliminación de un exón de cambio de marco de lectura de 92 pares de bases, pero permanece intacto en otros grandes simios. CMAH codifica una enzima que convierte el ácido siálico Neu5Ac en Neu5Gc, y su pérdida restringe la infección por patógenos dependientes de Neu5Gc (por ejemplo, el parásito de la malaria Plasmodium reichenowi), pero aumenta la susceptibilidad a virus que se unen a Neu5Ac. Inicialmente, se especuló que la pérdida de CMAH en humanos podría explicar la expansión cerebral específica de los humanos, pero posteriormente se demostró que otros mamíferos también carecían de la función de CMAH. Al combinar la alineación completa del genoma de Cactus con análisis de cobertura de lecturas y alineación de secuencias codificantes, descubrimos que CMAH ha sido inactivado en 40 de las 239 especies analizadas, lo que representa 10 linajes. Confirmamos que la pérdida de CMAH ocurrió en el ancestro de todos los mustélidos y pinípedos utilizando 11 especies y que, entre los primates, solo los humanos y los monos platirrinos han perdido CMAH. El papel de CMAH en la respuesta a patógenos sugiere que su pérdida podría influir en el potencial zoonótico de patógenos dependientes de Neu5Gc, aunque se necesita una investigación adicional.

Resolución a Nivel de un Solo Base de la Restricción[edit]

Las regiones codificantes son las más enriquecidas en posiciones evolutivamente restringidas, pero la mayoría (80%) de las posiciones restringidas son no codificantes. Definimos una "base restringida" como una posición con un puntaje phyloP positivo con FDR < 5%. Las bases restringidas comprenden el 3.26% (101 Mb) del genoma humano, están dentro de 5 pb de otra base restringida y el 30% se encuentra en bloques ≥5 pb.

Los puntajes phyloP, que indican la conservación evolutiva, presentan una repetición cada tres bases en las secuencias codificantes, lo cual concuerda con el código genético. La capacidad para mostrar patrones de restricción esperados en estas secuencias sugiere que se puede identificar restricciones hasta a nivel de bases individuales en el genoma humano. Comparativamente, al analizar los exomas de 141,456 individuos, solo se pudo obtener una resolución a nivel de genes o exones.

  • Los codones de metionina que funcionan como codones de inicio son más conservados que las metioninas en otras partes del péptido.
  • Las cisteínas en puentes de disulfuro intrapéptidos, que pueden causar mal plegamiento cuando están mutadas, son más conservadas que otras cisteínas.
  • Las bases restringidas en mamíferos son menos propensas a ser variables en humanos, lo cual concuerda con la selección purificadora.

Recopilaciones de elementos conservados[edit]

En este estudio, se amplió y perfeccionó el catálogo de elementos ultraconservados en el genoma humano mediante la alineación Cactus, incrementándolo en 13 veces y proporcionando así un recurso valioso para explorar rasgos esenciales en mamíferos. El conjunto original de 481 elementos ultraconservados en mamíferos consiste en elementos con una longitud superior a 200 pb y una secuencia idéntica entre humano, ratón y rata. La mayoría de ellos no codifican proteínas y muchos funcionan como potenciadores durante el desarrollo embrionario.

Se introduce el término "elementos ultraconservados de Zoonomia" (zooUCEs) para referirnos a regiones de 20 pb o más donde cada posición es idéntica en al menos 235 de las 240 (98%) especies en la alineación. Al igual que los elementos ultraconservados originales, se encuentran enriquecidos cerca de genes cuyos productos están involucrados en procesos biológicos relacionados con la transcripción y el desarrollo.

Además, se generó un catálogo de regiones restringidas en el genoma humano utilizando un indicador basado en el puntaje phyloP, lo que permitió una mayor variabilidad en la restricción a lo largo de los mamíferos en comparación con los criterios de zooUCE.

La restricción indica una función regulatoria[edit]

La métrica de restricción de Zoonomia puede ser útil para identificar posiciones con probables funciones regulatorias tanto dentro como fuera de las regiones codificantes. Las bases no codificantes bajo restricción están enriquecidas en elementos reguladores en mamíferos y dentro de primates, incluyendo firmas similares a promotores, firmas similares a potenciadores, sitios vinculados a CTCF y sitios marcados por H3K4me3.

Restricción no anotada[edit]

Casi la mitad de todas las bases bajo restricción (48.5%) se encuentran en regiones sin anotaciones en los miles de tipos celulares, tejidos o condiciones analizados por ENCODE3. Se agruparon las bases bajo restricción (phyloP FDR < 5%) que están a menos de 5 pb de distancia en regiones intergénicas no anotadas (excluyendo repeticiones, centrómeros y telómeros) para definir 423,586 elementos, a los cuales llamamos regiones restringidas intergénicas no anotadas (UNICORNs, por sus siglas en inglés). Muchas de estas regiones no anotadas son probablemente funcionales en condiciones que no fueron analizadas en el ENCODE3 humano.

Áreas de evolución acelerada[edit]

En la evolución reciente de la línea humana, se ha sugerido que parte de los cambios pueden deberse a modificaciones en la estructura tridimensional del genoma, lo que puede alterar la regulación génica. Para identificar regiones "aceleradas" que están altamente restringidas en mamíferos pero excepcionalmente variables en linajes particulares, desarrollamos un proceso automatizado. Descubrimos 312 regiones aceleradas en humanos y 141 en chimpancés, la mayoría de las cuales son no codificantes. Las regiones aceleradas en humanos (82%) y chimpancés (86%) tienden a tener firmas de selección positiva. La estructura tridimensional del genoma se ve alterada por variantes estructurales específicas de los humanos, sugiriendo un papel para la apropiación de potenciadores en la evolución específica de estas ubicaciones.

Catalogamos elementos transponibles en los genomas de 248 especies. Los elementos transponibles son secuencias móviles de ADN de 100 a 10,000 pares de bases que pueden acumularse en más de un millón de copias por genoma. Al analizar la clase, cantidad y distribución de elementos transponibles en estas especies. Hay poca variación entre mamíferos en la fracción del genoma ocupada por elementos transponibles, lo que concuerda con un equilibrio entre la acumulación y pérdida de ADN. La acumulación reciente, especialmente de retrotransposones, se correlaciona positivamente con el tamaño del genoma.

En particular, los murciélagos son un punto caliente para la transferencia horizontal de transposones de ADN, con más de 200 eventos, en comparación con solo 11 transferidos a otros linajes. Alrededor del 11% de las bases humanas bajo restricción se encuentran en elementos transponibles, con una mayor restricción en repeticiones simples y transposones de ADN, y una menor en elementos nucleares interespaciados cortos, repeticiones de terminales largas y repeticiones satélite. La mayoría (87%) de los sitios de unión a factores de transcripción específicos de primates se superponen con elementos transponibles, a diferencia de la mayoría de los sitios no específicos de primates (30%). Se sugiere que los elementos transponibles pueden ser impulsores de innovaciones regulatorias recientes en primates, aunque con la precaución de que no se ha confirmado la función regulatoria de los sitios de unión.

Relacionando el genotipo con el fenotipo[edit]

La herramienta Zoonomia proporciona una oportunidad única para investigar la evolución de características destacadas en mamíferos, conectando la variación genómica con fenotipos a nivel de especies en una amplia gama de especies. Utilizamos pruebas para examinar diferentes formas de evolución, incluyendo cambios en el número de genes, la secuencia genética y la regulación génica.

Habilidad Olfatoria[edit]

La capacidad olfativa en mamíferos varía ampliamente, adaptándose a diferentes nichos ecológicos. Para entender la evolución olfativa, se identificaron genes de receptores olfativos en el genoma de 249 especies de mamíferos mediante la anotación genómica con modelos ocultos de Markov de perfiles de receptores mamíferos.

  • Los roedores, en promedio, tienen más genes de receptores olfativos que otros mamíferos. El agutí centroamericano es el líder entre los roedores (3233 genes), superando en cantidad a todas las especies, excepto tres (el perezoso de Hoffmann, el armadillo de nueve bandas y el elefante africano de la sabana).
  • Los cetáceos tienen la variación más estrecha de todas las órdenes. Todos los cetáceos (17 especies) tienen repertorios excepcionalmente pequeños de genes de receptores olfativos en comparación con otros mamíferos. Las ballenas con barbas retienen estructuras olfativas que se perdieron en las ballenas dentadas, y, en concordancia con esta evidencia anatómica de capacidad olfativa, las cuatro especies de ballenas con barbas en Zoonomia tienen más genes de receptores olfativos que las 13 ballenas dentadas.

La asociación entre el número de turbinales olfativos y el repertorio de genes de receptores olfativos en mamíferos placentarios sugiere que ambos evolucionan en respuesta a la selección de la capacidad olfativa. Los turbinales olfativos son una característica anatómica de la cavidad nasal que se sabe que afecta la capacidad olfativa. En 64 especies evaluadas para ambos rasgos, el número de turbinales olfativos se correlaciona con el número de genes de receptores olfativos. Las especies que viven en grupo, se asocia a un menor número de genes, se especula porque los animales sociales dependen menos del sentido del olfato.

Hibernación[edit]

En conjunto de datos de alineación de genes, se incluyeron a 22 animales que hibernan profundamente (especies capaces de reducir la temperatura central por debajo de 18°C durante más de 24 horas) y a 154 homeotermos estrictos (especies que mantienen una temperatura corporal constante). En las principales líneas de mamimero, se encuentran formas de letargo, lo que sugiere que la depresión metabólica a través de la heterotermia existía de alguna forma en el ancestro de todos los mamíferos.

Al comparar hibernadores y homeotermos estrictos con la secuencia de genes reconstruida del mamífero ancestral mediante genómica evolutiva (forward genomics), se identificaron a 28 regiones de 100 pb (pFDR < 0.05) en 20 genes donde los hibernadores están menos divergentes del ancestro mamífero placentario. Dos de estos genes, MFN2 y PINK1, se superponen a cuatro conjuntos de genes relacionados con el proceso biológico de la despolarización y degradación de las mitocondrias dañadas, un orgánulo esencial para la depresión metabólica.

Al realizar pruebas con RERconverge, se identificaron 22 genes adicionales que evolucionan de manera inusualmente rápida o lenta en hibernadores en comparación con los homeotermos. Se encuentro que hay 11 genes que que evolucionan más rápido y 11 que evolucionan más lentamente en especies hibernantes. Los genes que evolucionan más rápido están enriquecidos en conjuntos de genes relacionados con la respuesta a la temperatura y la inmunidad. Entre los genes que evolucionan más rápido en hibernadores se encuentran HSPD1 (involucrado en la adaptación al estrés subyacente al letargo en mamíferos), el inhibidor de la vía mTor ADAMST9 (también implicado en la longevidad) y dos genes relacionados con trastornos del neurodesarrollo: el gen del canal de sodio voltaje-gateado SCN2A y el gen de la membrana K-Cl.

Características neurológicas[edit]

Utilizando TACIT (TissueAware Conservation Inference Toolkit) se puede asociar las diferencias en los elementos cis-reguladores, un importante impulsor de la divergencia fenotípica, con diferencias en fenotipos que incluyen el tamaño del cerebro y el aprendizaje vocal. TACIT no utiliza datos de expresión génica directamente, utiliza características de secuencias cis-reguladoras en un tejido o tipo celular de interés de unas pocas especies para entrenar modelos de aprendizaje automático que se pueden usar para predecir la actividad en ese tejido o tipo celular en elementos cis-reguladores ortólogos en muchas especies.

Se utilizo TACIT a rasgos fenotipados en más de 80 especies de Zoonomia que se proponen implicar tipos celulares neurales para los cuales tenemos datos de elementos cis-reguladores de múltiples especies (corteza motora y neuronas de parvalbúmina).

El tamaño del cerebro, medido en relación con el tamaño corporal, está asociado con la actividad predicha en elementos cis-reguladores que están activos en la corteza motora y las neuronas de parvalbúmina (49 de 98,912 elementos probados para la corteza motora, cuatro especies con datos de entrenamiento, 158 especies probadas; 15 de 35,034 elementos probados para neuronas de parvalbúmina, dos especies con datos de entrenamiento, 72 especies probadas) (pFDR de permutación consciente de la filogenia < 0.15). Los elementos cis-reguladores cerca de genes previamente implicados en microcefalia o macrocefalia tienden a tener asociaciones más significativas con el tamaño del cerebro en mamíferos.

En un análisis de 175 especies fenotipadas, tanto los cambios en proteínas como los cambios cis-regulatorios estuvieron asociados con la capacidad para el aprendizaje vocal.

El aprendizaje vocal es la habilidad de imitar sonidos no innatos y probablemente evolucionó convergentemente en humanos, murciélagos, cetáceos y pinnípedos. Los elementos cis-reguladores candidatos activos en la corteza motora y las neuronas de parvalbúmina se identificaron elementos de la corteza motora cercanos a genes como GALC, TSHZ3 y otros genes relacionados con trastornos del habla.

Utilizando la genómica para la conservación de la biodiversidad[edit]

En Zoonomia, se puede aplicar para ver la biodiversidad de las especies. Con este recurso se observó que las especies de Zoonomia con tamaños históricos más pequeños de población efectiva llevan una carga genética fija más alta, con proporcionalmente más sustituciones no sinónimas y sustituciones en sitios restringidos. Los puntajes de restricción evolutiva permiten la estimación empírica de la carga genética perjudicial y sus impulsores demográficos en especies diversas.

Las especies con un tamaño histórico más pequeño de población efectiva también tienen más probabilidades de ser clasificadas como amenazadas por la Unión Internacional para la Conservación de la Naturaleza (UICN), lo que sugiere que los procesos históricos son predictivos del estado de riesgo de extinción contemporáneo de las especies. Las especies amenazadas tienen menos sustituciones en sitios extremadamente restringidos, especialmente en primates, mientras que lo opuesto es cierto para las sustituciones no sinónimas, posiblemente porque los alelos gravemente perjudiciales han sido eliminados o perdidos por deriva genética.

References[edit]

Matthew J. Christmas et al., Evolutionary constraint and innovation across hundreds of placental mammals. Science380, eabn3943(2023). DOI:10.1126/science.abn3943