Skip to main content
Pipeline Build 12 min read

Diseño de guías CRISPR para TP53: flujo de trabajo de extremo a extremo

Un recorrido completo por el diseño de ARN guía CRISPR dirigidos a TP53 usando el pipeline de Hordago — desde la entrada del gen hasta guías ranqueadas con análisis off-target y trazabilidad completa de procedencia.

Jeff Jaureguy
Human genome hg38, A549 cell line
CRISPRon Cas-OFFinder CHOPCHOP biocontext7

Resumen

TP53 es el gen mutado con mayor frecuencia en los cánceres humanos. Diseñar ARN guía CRISPR eficaces para hacer knockout de TP53 requiere equilibrar la eficiencia on-target con la minimización de efectos off-target. En este episodio, recorremos el pipeline completo de Hordago para el diseño de guías CRISPR.

Paso 1: definir la diana

Empezamos especificando el gen, el ensamblaje del genoma y el contexto de línea celular:

hordago crispr design --gene TP53 --cell-line A549

El pipeline automáticamente:

  • Resuelve TP53 a su transcrito canónico (ENST00000269305)
  • Identifica todos los exones en la secuencia codificante
  • Escanea sitios PAM (NGG) dentro de las regiones exónicas

Paso 2: puntuación on-target

Cada ARN guía candidato se puntúa usando CRISPRon, que predice la eficiencia de corte a partir de características de secuencia y accesibilidad de la cromatina:

import pandas as pd

guides = pd.read_csv("guides.tsv", sep="\t")
print(guides[["guide_id", "sequence", "on_target_score"]].head())
guide_idsequenceon_target_score
TP53-g1GCAGCCTTTGTGAACCAACA0.92
TP53-g2TGGTTCTCACTTGGTGGAAG0.89
TP53-g3AGCAGGTCTGTTCCAAGGGA0.87

Paso 3: análisis off-target

Cas-OFFinder escanea todo el genoma en busca de posibles sitios off-target, permitiendo hasta 3 mismatches:

cas-offinder input.txt G output.txt

Los resultados muestran que TP53-g3 tiene los menos off-target hits, mientras que TP53-g1 tiene la mayor puntuación on-target — un compromiso clásico.

TP53-g1: 12 off-target sites (max 3 mismatches)
TP53-g2: 18 off-target sites
TP53-g3: 5 off-target sites

Paso 4: ranking final

El pipeline combina las puntuaciones on-target y off-target en un ranking compuesto:

RESULTS: 3 guides ranked
  TP53-g1  GCAGCCTTTGTGAACCAACA  on=0.92  off=0.02  rank=1
  TP53-g3  AGCAGGTCTGTTCCAAGGGA  on=0.87  off=0.01  rank=2
  TP53-g2  TGGTTCTCACTTGGTGGAAG  on=0.89  off=0.04  rank=3

Antes y después

Antes: flujo manual

  • Más de 3 horas cambiando manualmente entre herramientas
  • Sin garantía de reproducibilidad
  • Resultados repartidos entre pestañas del navegador

Después: pipeline de Hordago

  • 4,2 segundos de extremo a extremo
  • Manifiesto de procedencia completo
  • Salida ranqueada con puntuación compuesta

Conclusiones clave

  1. Los pipelines automatizados eliminan el error humano en flujos multi-herramienta
  2. El seguimiento de procedencia garantiza que cada resultado se pueda reproducir
  3. La puntuación compuesta hace emerger la mejor guía equilibrando eficiencia vs. seguridad
  4. El contexto de línea celular (A549) del pipeline considera el estado de la cromatina, lo que mejora las predicciones on-target

Provenance Manifest

{
  "workflow": "crispr-guide-design",
  "version": "1.3.0",
  "timestamp": "2026-03-14T09:12:43Z",
  "inputs": {
    "gene": "TP53",
    "genome": "hg38",
    "cell_line": "A549",
    "pam": "NGG"
  },
  "tools": {
    "CRISPRon": "1.0.0",
    "Cas-OFFinder": "2.4.1",
    "CHOPCHOP": "3.0.0"
  },
  "git_commit": "a3f8c12",
  "outputs": [
    "guides.tsv",
    "offtargets.tsv",
    "summary.pdf"
  ]
}