El sesgo eurocéntrico en los mapas génicos
Al centrarse casi exclusivamente en una fracción de la variabilidad humana, los mapas de referencia actuales omiten variantes biológicas crÃticas para la salud de poblaciones globalmente subrepresentadas.
Un error sistemático puede distorsionar los resultados de una investigación y aumentar el riesgo de tomar malas decisiones clÃnicas. Por eso, el sesgo no es bienvenido en medicina.
Equivocaciones metodológicas pueden sobrestimar o subestimar el efecto real de una intervención o asociación, llevando a conclusiones incorrectas y comprometiendo la validez de los hallazgos, además de conducir a tratamientos ineficaces y desigualdades en la atención de los pacientes [1].
En la era de la medicina personalizada, los modelos de riesgo genético -como las puntuaciones poligénicas (PRS)- se presentan como una herramienta clave para predecir susceptibilidad a distintas enfermedades [2]. Sin embargo, existe un problema de base: la enorme mayorÃa de los estudios que nutren estos modelos han reclutado participantes de ascendencia europea [3].
Como consecuencia, estas PRS tienen una portabilidad limitada. Varios estudios evidencian que su capacidad discriminativa decae notablemente en poblaciones africanas, asiáticas o latinoamericanas [4]. Esto se confirma en una nueva investigación publicada en Nature Communications [5] que demuestra que los principales mapas genéticos que sirven de base para la biomedicina contienen vacÃos importantes al ser elaborados sobre datos mayoritariamente europeos.
Falta de representación
Según el trabajo realizado por investigadores del Barcelona Supercomputing Center (BSC) y del Centro de Regulación Genómica (CRG), ambos de España, esta falta de representación distorsiona el conocimiento sobre cómo los genes influyen en la salud y la enfermedad.
"El uso de referencias genómicas eurocéntricas no considera variaciones biológicas relevantes, por lo tanto, estamos dejando fuera enormes segmentos de la población. Este estudio muestra, por primera vez, cuánto nos estábamos perdiendo", comentó Pau Clavell-Revelles, autor principal.
Este riesgo se traduce en que herramientas útiles en un contexto podrÃan ser poco confiables en otro, perpetuando desigualdades y limitando el alcance global de la medicina genómica.Â
"Hemos identificado miles de transcritos ausentes en los mapas génicos oficiales, incluidos centenares de posibles nuevos genes aún no descritos", agregó.
Brecha cientÃfica
Desde los años noventa, gran parte de los estudios genéticos se ha basado en poblaciones de ascendencia europea. Esto se debe a razones históricas, económicas y logÃsticas: era más barato, sencillo y rápido reclutar participantes en centros de investigación occidentales [6].
El resultado es un desequilibrio que repercute en múltiples áreas. Cuando la base de datos inicial es limitada, los modelos que se construyen a partir de ella -desde mapas genéticos hasta herramientas de predicción de riesgo- tienden a favorecer a los mismos grupos sobrerrepresentados [7].
El sesgo en los mapas genéticos influye directamente en la capacidad de identificar variantes relevantes en distintas poblaciones. Una mutación que está bien caracterizada en europeos puede pasar desapercibida en personas de origen africano, indÃgena o asiático [8].
Esto afecta la precisión de los diagnósticos. Algunas herramientas de cribado genético funcionan mejor para ciertos grupos y peor para otros, creando una brecha cientÃfica que se traduce en desigualdades en salud [7].
También limita la capacidad de descubrir nuevas conexiones entre genes y enfermedades. Las poblaciones subestudiadas poseen una diversidad genética mucho mayor que la europea promedio, lo que significa que la ciencia está ignorando un vasto territorio por cartografiar [9].
La punta de un iceberg
El estudio liderado por Pau Clavell-Revelles analizó células sanguÃneas de 43 personas de ocho poblaciones: Yoruba (Nigeria), Luhya (Kenia), Mbuti (Congo), chinos Han, indios Telugu, peruanos de Lima, judÃos asquenazÃes e individuos de ascendencia europea de Utah. Se utilizó secuenciación de ARN de lectura larga (long-read RNA sequencing), una técnica que permite leer moléculas completas, de un extremo a otro, sin fragmentarlas en pedazos pequeños. Asà se identificaron 41 mil transcritos potenciales ausentes en los catálogos de referencia GENCODE [10].
"En el caso de los transcritos que provienen de genes codificadores de proteÃnas, se estima que el 41% producirÃa versiones distintas a las ya conocidas. Encontramos ejemplos reveladores como una variante especÃfica del gen SUB1, relacionada con la reparación del ADN, presente en personas de ascendencia peruana y completamente ignorada por las anotaciones existentes", explicó el cientÃfico.
El análisis por grupos de ascendencia evidenció que las muestras no europeas contenÃan una proporción mucho mayor de transcritos nunca catalogados: se documentaron 2.267 transcritos exclusivos de una única población.
Mientras que la mayorÃa de los transcritos europeos ya figuraba en los mapas oficiales, la mayorÃa de los africanos, asiáticos y americanos aparecÃa por primera vez. Además, 773 transcritos parecÃan originarse en regiones génicas no reconocidas previamente, lo que sugiere la existencia de nuevos genes aún sin describir. "Esto confirma que depender de una única referencia universal oculta variaciones biológicas relevantes".
Pese a las limitaciones del trabajo, los investigadores creen que los resultados obtenidos son solo la punta de un iceberg. Por eso plantean la necesidad de construir un pantranscriptoma humano, vale decir, un catálogo completo de todas las moléculas de ARN utilizadas en todos los tejidos, etapas de la vida y poblaciones.
Para lograrlo se requiere un esfuerzo colectivo, que garantice una medicina genómica justa, precisa e inclusiva, evitando disparidades, aumentando la representatividad y la eficacia de los tratamientos personalizados.
BibliografÃa:
[1] ¿Qué es el sesgo médico? Nota de prensa. Quality Interactions. https://www.qualityinteractions.com/blog/what-is-medical-bias
[2] Kullo IJ, Lewis CM, Inouye M, Martin AR, Ripatti S, Chatterjee N. Polygenic scores in biomedical research. Nat Rev Genet. 2022 Sep;23(9):524-532.
[3] Duncan L, Shen H, Gelaye B, Meijsen J, Ressler K, Feldman M, Peterson R, Domingue B. Analysis of polygenic risk score usage and performance in diverse human populations. Nat Commun. 2019 Jul 25;10(1):3328.
[4] Kim MS, Naidoo D, Hazra U, Quiver MH, Chen WC, et al. Testing the generalizability of ancestry-specific polygenic risk scores to predict prostate cancer in sub-Saharan Africa. Genome Biol. 2022 Sep 13;23(1):194.
[5] Clavell-Revelles P, Reese F, Carbonell-Sala S, Degalez F, Oliveros W, Arnan C, Guigó R, Melé M. Long-read transcriptomics of a diverse human cohort reveals widespread ancestry bias in gene annotation. bioRxiv [Preprint]. Nat Commun. 2025 Mar 17:2025.03.14.643250.
[6] El sesgo occidental en los estudios genéticos humanos es "cientÃficamente perjudicial e injusto". Noticias cientÃficas. ScienceDaily. https://www.sciencedaily.com/releases/2019/03/190321130447.htm
[7] Martin AR, Gignoux CR, Walters RK, Wojcik GL, Neale BM, Gravel S, Daly MJ, Bustamante CD, Kenny EE. Human Demographic History Impacts Genetic Risk Prediction across Diverse Populations. Am J Hum Genet. 2017 Apr 6;100(4):635-649.
[8] Kim MS, Patel KP, Teng AK, Berens AJ, Lachance J. Genetic disease risks can be misestimated across global populations. Genome Biol. 2018 Nov 14;19(1):179.
[9] Troubat L, Fettahoglu D, Henches L, Aschard H, Julienne H. Multi-trait GWAS for diverse ancestries: mapping the knowledge gap. BMC Genomics. 2024 Apr 17;25(1):375.
[10] GENCODE. https://www.gencodegenes.org/
Por Óscar Ferrari Gutiérrez