En un estudio reciente publicado en el bioRxiv* servidor de preimpresión, los investigadores desarrollan un método basado en un enfoque automatizado y heurístico que utiliza información de genotipo ancestral compartido para definir linajes de patógenos en árboles filogenéticos, al mismo tiempo que prioriza linajes por mutaciones clave, tasa de crecimiento y ubicación.
Estudiar: Designación agnóstica automatizada de linajes de patógenos. Haber de imagen: Gorodenkoff/Shutterstock.com
Fondo
Table of Contents
La identificación y la nomenclatura de los linajes patógenos son importantes desde la perspectiva del tratamiento, las comunicaciones relacionadas con la enfermedad y la investigación. Los sistemas de nomenclatura de los patógenos generalmente se basan en el genotipo, el fenotipo y la geografía.
La serología o la vulnerabilidad antibiótica son los dos fenotipos utilizados para clasificar los patógenos. Comparativamente, se aplica una nomenclatura basada en la geografía a los patógenos que tienen especies no humanas como reservorios, como los virus Zaire Ebola y Chikungunya.
La clasificación basada en genotipos se enfoca en la resolución de patógenos en un árbol filogenético en clados recíprocamente monofiléticos o exclusivos, con las muestras en un clado que se infiere que descienden de un ancestro común. Este método se había utilizado para el virus respiratorio sincitial, el virus de la influenza y el virus del dengue.
El sistema de nomenclatura Phylogenetic Assignment of Named Global Outbreak (Pango), que es un sistema de clasificación basado en genotipos, utiliza propuestas de linaje de colaboración colectiva y ha proporcionado los nombres para todas las variantes del síndrome respiratorio agudo severo coronavirus 2 (SARS-CoV-2) de inquietud.
Sin embargo, dado que Pango requiere que los linajes se seleccionen y designen manualmente, el creciente volumen de datos y la disminución de las inversiones públicas, así como el sesgo personal y regional al evaluar la importancia de las diferentes mutaciones, resaltan la necesidad de una métrica más optimizada y objetiva. para designar linajes patógenos emergentes.
Sobre el estudio
En el presente estudio, los investigadores proponen un enfoque heurístico para definir y ampliar la nomenclatura basada en genotipos, que utiliza longitudes de rama de filogenias escaladas a distancia genética. Este método puede expandir los sistemas de nomenclatura de patógenos existentes y generar una nueva nomenclatura para patógenos emergentes.
El método propuesto está optimizado para utilizar la información de haplotipos a nivel de muestra y se puede aplicar a grandes árboles filogenéticos para producir una disposición jerárquica de distintos linajes. También se puede incorporar una serie de parámetros de usuario para permitir que los investigadores y epidemiólogos sopesen elementos críticos de definición de linaje y esfuerzos de seguimiento para cada patógeno.
La utilidad de este método se evaluó utilizando la filogenia global del SARS-CoV-2. En base a su éxito, los investigadores colaboraron con los investigadores de Pango para incorporar este método en el sistema de nomenclatura de linaje SARS-CoV-2 existente.
Además, se evaluó el potencial del uso de este método para otros patógenos al probarlo contra el virus Chikungunya y las filogenias complejas del virus de la encefalitis equina venezolana (EEV).
Resultados
El nuevo método basado en el enfoque heurístico fue eficiente para analizar filogenias extremadamente grandes. Cuando se probó con la última filogenia global de SARS-CoV-2, este enfoque produjo resultados similares a las designaciones de linaje existentes basadas en el sistema de clasificación Pango.
El índice de representación del genotipo (GRI), que se calcula con base en el número de descendientes de un nodo, se definió como la longitud de la rama entre el nodo y el linaje padre o raíz del árbol filogenético, así como la longitud de la rama entre el nodo y el cada punta o descendiente. Por lo tanto, siempre que las longitudes de las ramas se basen en la distancia genética, el GRI se puede calcular para cualquier filogenia arraigada.
La designación del linaje se basa en valores altos de GRI en los nodos internos. El método propuesto utiliza un proceso iterativo para definir linajes jerárquicos. Además, los elementos epidemiológicamente importantes, como la transmisión internacional y los cambios en la secuencia de proteínas, pueden utilizarse para un cálculo ponderado del GRI.
La aplicación de este sistema de nomenclatura a las filogenias de Chikungunya y VEE reveló que mientras la designación de linaje automatizada corroboraba el sistema de nomenclatura Chikungunya existente que se basaba en la geografía, el sistema de nomenclatura VEE, que se basaba en la serología, era parafilético en el sistema de nomenclatura automatizado y no no forman ningún clado.
Comparación de la designación del subtipo serológico (árbol de la izquierda) con la designación del linaje automatizado (árbol de la derecha) del complejo del virus de la encefalitis equina venezolana (VEE), con base en un árbol generado previamente por el oleoducto Augur (Huddleston y otros 2021) y visualizado en FigTree v. 1.4.4. Según la nomenclatura actual, la EEV engloba el virus Everglades (EVEV), el virus Mucambo (MUCV), el virus Tonate (TONV), el virus Pixuna (PIXV), el virus Cabassou (CABV), el virus Rio Negro (RNV), el virus Mosso das Pedras ( MDPV), el virus Pirahy (PIRAV) y el virus de la encefalitis equina venezolana (VEEV). El clado VEEV está etiquetado en el árbol.
Limitaciones del método
Dado que el sistema de clasificación se basa en filogenias, los nuevos datos y la optimización de los árboles filogenéticos pueden cambiar la relación entre los linajes e invalidar los linajes existentes. Sin embargo, dado que actualmente no existe un sistema o una definición universal para clasificar los taxones por debajo del nivel de especie, este método proporciona un método uniformemente aplicable y simplificado para clasificar los patógenos.
Conclusiones
En general, los resultados sugieren que el sistema de designación de linaje automatizado presentado en este estudio proporciona un método flexible, genérico y simplificado para expandir los sistemas de nomenclatura de patógenos existentes y definir linajes para patógenos emergentes utilizando filogenias e información de longitud de rama.
*Noticia importante
bioRxiv publica informes científicos preliminares que no son revisados por pares y, por lo tanto, no deben considerarse concluyentes, guiar la práctica clínica/el comportamiento relacionado con la salud ni tratarse como información establecida.
Referencia de la revista:
- McBroome, J., de Bernardi Schneider, A., Roemer, C., et al. (2023). Designación agnóstica automatizada de linajes de patógenos. bioRxiv. doi:10.1101/2023.02.03.527052


