382 isoleucinas que sobraban

382 isoleucinas que sobraban#

Todos los organismos conocidos usan 20 aminoácidos canónicos. El Wang Lab de Columbia probó si una Escherichia coli podía vivir con 19 — quitándole la isoleucina. Para empezar, rediseñaron el ribosoma reemplazando los 382 residuos de Ile distribuidos en sus 50 proteínas. Este notebook recrea ese conteo desde el FASTA público y explora cómo se reparte el trabajo de rediseño.

El hallazgo: El ribosoma de E. coli contiene 382 residuos de Ile en 50 proteínas, y 10 de esas proteínas concentran el 37 % de todo el rediseño.

Gráfica clave#

Distribución de Ile por proteína ribosomal

Reproducir#

Abrir en Colab

O localmente:

pip install pandas matplotlib numpy
jupyter execute notebook.ipynb

Datos#

  • datos/ecoli_ribosomal_genes.fasta — 50 secuencias proteicas wild-type del ribosoma de E. coli (UniProt), tomadas del repo del paper.

  • datos/ribosomal_genes_ile.csv — Tabla derivada: 50 filas con uniprot_id, gene_name, length_aa, ile_count, val_count, ile_pct.

  • datos/aa_composition_global.csv — Composición global de los 20 aminoácidos sobre las 50 proteínas (counts + porcentajes).