🔬 ¿Cuántas secuencias 16S necesito para mi muestra? Esta es una pregunta frecuente en estudios de diversidad microbiana. Para abordarla de manera práctica, puede consultarse una tabla comparativa con índices ecológicos alfa obtenidos de distintos ambientes, basada en análisis de comunidades mediante secuencias del gen ribosomal 16S. Estos datos ofrecen una referencia útil para estimar la profundidad de secuenciación adecuada según el tipo de muestra. En general, ambientes altamente diversos —como los suelos— requieren un mayor número de secuencias para capturar al menos el 95% de su diversidad, en comparación con ambientes menos complejos —como los extremófilos—. El objetivo es que, al aplicar una curva de rarefacción con estos valores, se alcance la asíntota, lo que indica que se ha muestreado suficientemente la comunidad microbiana.
📈 ¿Qué es una curva de rarefacción? Es una representación gráfica que muestra cómo aumenta el número de especies observadas conforme se incrementa el número de secuencias analizadas. En microbiología, se usa comúnmente con datos del gen 16S para estimar la riqueza de especies (OTUs o ASVs) en una muestra.
Este índice evalúa el grado de incertidumbre al predecir a qué especie pertenece un individuo tomado al azar de una comunidad. Cuanto mayor es su valor, más equilibrada y diversa es la comunidad, lo que refleja una presencia amplia de especies sin dominancias marcadas.
Mide la probabilidad de que dos individuos seleccionados al azar pertenezcan a la misma especie. Para resaltar la diversidad, suele utilizarse su forma complementaria, que aumenta conforme la comunidad tiene menos especies dominantes y una distribución más equitativa. Valores altos indican ecosistemas variados y balanceados.
Es una herramienta para estimar cuántas especies existen en total, incluso aquellas que no se detectaron directamente. Se basa en la presencia de especies raras en la muestra —cuantas más especies poco frecuentes se observan, mayor es el ajuste hacia una riqueza estimada más alta.
Para maximizar la representación de la diversidad microbiana (Good’s coverage ≥ 95 %), conviene adaptar la profundidad de secuenciación al grado de riqueza (estimador Chao1) y desigualdad de abundancias de cada muestra. Como regla práctica, se recomienda generar entre 8 y 12 veces el número de lecturas que la riqueza estimada (Chao1) sugiere:
Suelos agrícolas (Chao1 ≈ 3 200) ⇒ ~40 000 lecturas (≈ 12×)
Suelos desérticos (Chao1 ≈ 6 000) ⇒ 50 000–70 000 lecturas (≈ 8–12×)
Compost municipal (Chao1 ≈ 4 800) ⇒ ~50 000 lecturas (≈ 10×)
Lagunas eutróficas (Chao1 ≈ 1 800) ⇒ ~20 000 lecturas (≈ 11×)
Microbioma fecal humano (Chao1 ≈ 1 500) ⇒ 10 000–15 000 lecturas (≈ 7–10×)
Océano global (Chao1 ≈ 3 000) ⇒ ~30 000 lecturas (≈ 10×)
Suelos permafrost (Chao1 ≈ 2 100) ⇒ ~25 000 lecturas (≈ 12×)
Lodos activados (Chao1 ≈ 1 500) ⇒ ~15 000 lecturas (≈ 10×)
Puntos clave:
Curvas de rarefacción: graficar el número de OTUs (eje Y) por secuencias (eje X). El punto donde la curva tiende a meseta (asíntota) indica cobertura suficiente (> 95 %).
Good’s coverage: un C ≥ 0.95 garantiza que la mayoría de la ‘colita’ de taxa raros está muestreada.
Complejidad del ambiente: Cuanto mayor sea la riqueza y asimetría (muchos taxa raros), más lecturas serán necesarias. En hábitats de diversidad extrema (sedimentos bentónicos profundos, suelos muy heterogéneos) puede ser preciso superar las 100 000–200 000 lecturas por muestra.
En la práctica, conviene:
Ensayar varias profundidades (por ejemplo, 10 k, 30 k, 50 k, 100 k) y construir curvas de rarefacción por muestra.
Ajustar número de ciclos PCR y usar controles para minimizar artefactos que inflen los singletons.
Combinar replicados biológicos y técnicos para evaluar variabilidad y asegurar reproducibilidad.
Así, calibrando el número de lecturas con base en riqueza estimada y rarefacción, se consigue una representación robusta (> 95 %) de la diversidad microbiana en casi cualquier ecosistema.