128 Genomas Indígenas Americanos: Dos Pistas Inesperadas

128 Genomas Indígenas Americanos: Dos Pistas Inesperadas#

Un equipo de 85 investigadores acaba de publicar el mayor conjunto de genomas indígenas americanos secuenciados hasta hoy: 128 individuos de alta cobertura, 45 poblaciones, 8 países. Aquí exploramos tres preguntas con los datos agregados del paper — cuellos de botella demográficos, aislamiento por distancia, y la señal australasiática compartida con Papúa/Australia.

El hallazgo: El aislamiento por distancia global en América (Spearman ρ = 0,50) es una paradoja de Simpson: dentro de Sudamérica la correlación cae a 0,15 y entre Norte y Sudamérica es negativa (ρ = −0,29). No fue una sola ola migratoria.

Gráfica clave#

Distribución de FROH por grupo mundial

Reproducir#

Abrir en Colab

O localmente:

pip install pandas matplotlib numpy scipy
jupyter execute notebook.ipynb

Datos#

  • datos/tabla1_128_genomas.csv — 128 individuos nuevos: población, cluster geográfico, familia lingüística, país, coordenadas.

  • datos/tabla4_roh_mundial.csv — FROH por individuo en 3.710 genomas mundiales (1000G + indígenas americanos).

  • datos/tabla7_distancias.csv — 1.378 pares de poblaciones con distancia geográfica y genética (pairwise outgroup-f3).

  • datos/tabla12_australasian_counts.csv — número de tests D con |Z|>3 por población (36 antiguas, 114 contemporáneas).

Todos extraídos del Supplementary Information del paper (MOESM3). Los genomas individuales están en EGA bajo acceso controlado (EGAD50000002396).