Resumen
TP53 es el gen mutado con mayor frecuencia en los cánceres humanos. Diseñar ARN guía CRISPR eficaces para hacer knockout de TP53 requiere equilibrar la eficiencia on-target con la minimización de efectos off-target. En este episodio, recorremos el pipeline completo de Hordago para el diseño de guías CRISPR.
Paso 1: definir la diana
Empezamos especificando el gen, el ensamblaje del genoma y el contexto de línea celular:
hordago crispr design --gene TP53 --cell-line A549
El pipeline automáticamente:
- Resuelve TP53 a su transcrito canónico (ENST00000269305)
- Identifica todos los exones en la secuencia codificante
- Escanea sitios PAM (NGG) dentro de las regiones exónicas
Paso 2: puntuación on-target
Cada ARN guía candidato se puntúa usando CRISPRon, que predice la eficiencia de corte a partir de características de secuencia y accesibilidad de la cromatina:
import pandas as pd
guides = pd.read_csv("guides.tsv", sep="\t")
print(guides[["guide_id", "sequence", "on_target_score"]].head())
| guide_id | sequence | on_target_score |
|---|---|---|
| TP53-g1 | GCAGCCTTTGTGAACCAACA | 0.92 |
| TP53-g2 | TGGTTCTCACTTGGTGGAAG | 0.89 |
| TP53-g3 | AGCAGGTCTGTTCCAAGGGA | 0.87 |
Paso 3: análisis off-target
Cas-OFFinder escanea todo el genoma en busca de posibles sitios off-target, permitiendo hasta 3 mismatches:
cas-offinder input.txt G output.txt
Los resultados muestran que TP53-g3 tiene los menos off-target hits, mientras que TP53-g1 tiene la mayor puntuación on-target — un compromiso clásico.
TP53-g1: 12 off-target sites (max 3 mismatches)
TP53-g2: 18 off-target sites
TP53-g3: 5 off-target sites
Paso 4: ranking final
El pipeline combina las puntuaciones on-target y off-target en un ranking compuesto:
RESULTS: 3 guides ranked
TP53-g1 GCAGCCTTTGTGAACCAACA on=0.92 off=0.02 rank=1
TP53-g3 AGCAGGTCTGTTCCAAGGGA on=0.87 off=0.01 rank=2
TP53-g2 TGGTTCTCACTTGGTGGAAG on=0.89 off=0.04 rank=3
Antes y después
Antes: flujo manual
- Más de 3 horas cambiando manualmente entre herramientas
- Sin garantía de reproducibilidad
- Resultados repartidos entre pestañas del navegador
Después: pipeline de Hordago
- 4,2 segundos de extremo a extremo
- Manifiesto de procedencia completo
- Salida ranqueada con puntuación compuesta
Conclusiones clave
- Los pipelines automatizados eliminan el error humano en flujos multi-herramienta
- El seguimiento de procedencia garantiza que cada resultado se pueda reproducir
- La puntuación compuesta hace emerger la mejor guía equilibrando eficiencia vs. seguridad
- El contexto de línea celular (A549) del pipeline considera el estado de la cromatina, lo que mejora las predicciones on-target