Longevity & AgingArtículo de investigaciónAcceso abierto

Los Relojes de Envejecimiento Más Populares Tienen Fallas Matemáticas y Pasan por Alto Biología Clave

Investigadores de UC Berkeley exponen una incoherencia crítica en los relojes de edad de metilación del DNA, demostrando que hasta el 54% de sus características contradicen las tendencias biológicas reales.

miércoles, 27 de mayo de 2026 0 visualizaciones
Publicado en Geroscience
a scientist at a computer screen displaying colorful scatter plots and regression lines overlaid on a DNA methylation array heatmap in a dimly lit research lab

Resumen

Investigadores de UC Berkeley han publicado una crítica rigurosa de los relojes de edad basados en metilación del DNA (DNAm) más utilizados, revelando que estos modelos de aprendizaje automático están optimizados matemáticamente de formas que oscurecen la biología real. Entre el 23,9% y el 53,8% de los sitios CpG seleccionados por los principales relojes presentan coeficientes de regresión que apuntan en dirección opuesta a su cambio real de metilación con el envejecimiento, un problema que los autores denominan «incoherencia». Estas variables mal alineadas representan entre el 11,2% y el 40,8% del peso total del modelo. Además, todos los relojes principales fallaron en detectar de forma fiable el inflammaging —el desplazamiento de células inmunitarias linfoides hacia mieloides que es uno de los marcadores del envejecimiento más bien establecidos. El artículo sostiene que la regresión elastic net, el método predominante para construir estos relojes, no es adecuada para identificar biomarcadores verdaderos del envejecimiento biológico, ya que excluye sistemáticamente los CpGs de alta varianza que señalan enfermedad y envejecimiento patológico.

Resumen detallado

Los relojes de edad biológica basados en la metilación del DNA se han convertido en un pilar de la investigación en longevidad: se utilizan para evaluar intervenciones, estimar el riesgo de enfermedad y, según se afirma, revelar mecanismos del envejecimiento. Sin embargo, una nueva comunicación rápida del laboratorio de Irina Conboy en UC Berkeley cuestiona los fundamentos científicos de estas herramientas, presentando evidencia cuantitativa de que los relojes más populares son matemáticamente incoherentes y biológicamente engañosos.

La crítica central se dirige al modelo de regresión elastic net (EN), el modelo lineal penalizado empleado para construir prácticamente todos los relojes de DNAm más importantes, incluidos Horvath, Hannum, PhenoAge, GrimAge y PACE. EN selecciona un subconjunto reducido de sitios CpG —típicamente unos pocos cientos de entre 500.000 y 800.000 sondas de microarray— y les asigna pesos de modo que su suma ponderada prediga la edad cronológica o una variable representativa. Los autores demuestran que este proceso de optimización es inherentemente sesgado: minimiza los residuos al favorecer los CpG con baja varianza entre muestras de la misma edad, lo que excluye sistemáticamente los CpG de alta varianza con mayor probabilidad de reflejar un envejecimiento patológico o acelerado. Las características más informativas para distinguir el envejecimiento saludable del patológico quedan así eliminadas por diseño.

El artículo introduce y cuantifica el concepto de «incoherencia»: sitios CpG cuyo signo del coeficiente en el modelo es opuesto a la dirección real del cambio univariante de metilación con la edad. En todos los relojes principales analizados, entre el 23,9 % y el 53,8 % de los sitios CpG seleccionados resultaron incoherentes; en algunos modelos, más de la mitad. Estas características desalineadas aportaron entre el 11,2 % y el 40,8 % del peso total del modelo. Los autores ofrecen una visualización interactiva de estas desalineaciones para cada modelo, haciendo el error transparente y reproducible. Esta incoherencia implica que, incluso cuando los residuos del reloj —la llamada «aceleración de la edad biológica»— son estadísticamente significativos, no pueden interpretarse de forma significativa como reflejo de la biología subyacente.

Un fallo especialmente llamativo que documenta el artículo es la incapacidad de estos relojes para detectar el inflammaging: el conocido desplazamiento relacionado con la edad desde poblaciones inmunitarias linfoides hacia mieloides, acompañado de una inflamación crónica de bajo grado. Dado que la mayoría de los relojes de DNAm se entrenan con conjuntos de datos derivados de sangre (PBMCs o leucocitos), el inflammaging debería ser la señal biológica más fácil de detectar. Sin embargo, las pruebas sistemáticas mostraron que las predicciones de los relojes se solapaban sustancialmente entre individuos sanos y pacientes con enfermedades inflamatorias crónicas, incluidas la artritis reumatoide, la esclerosis múltiple, la enfermedad de Parkinson y las tauopatías. Incluso el reloj PACE, entrenado con puntuaciones de riesgo de enfermedad, tuvo dificultades para resolver esta distinción y funcionó principalmente como predictor de la edad cronológica.

Los autores aclaran además que los relojes EN también presentan un sesgo hacia las señales de fracción celular de leucocitos, con la composición de neutrófilos dominando muchos modelos. Cuando se corrige la incoherencia —alineando los signos de los coeficientes con las direcciones reales de metilación—, el modelo corregido muestra una mejor discriminación entre poblaciones sanas y de pacientes, un menor sesgo hacia los neutrófilos y una mejor detección del inflammaging, a costa de una menor precisión en la predicción de la edad cronológica. Esta compensación, argumentan los autores, es fundamental y no se reconoce suficientemente: priorizar el ajuste matemático a la progresión temporal sacrifica necesariamente la interpretabilidad biológica. El artículo concluye abogando por enfoques de ML no lineales que tracen la trayectoria natural del envejecimiento a partir de datos primarios, sin imponer un marco lineal sobre un proceso que es inherentemente no lineal.

Hallazgos clave

  • Between 23.9% and 53.8% of CpG sites selected by major DNAm age clocks have regression coefficients pointing in the opposite direction from their actual methylation change with aging (termed 'incoherence')
  • These incoherent features account for 11.2% to 40.8% of total model weight across clocks, meaning a substantial fraction of each model's predictive power is biologically misaligned
  • All major conventional DNAm clocks failed or struggled to distinguish chronic inflammatory disease states (rheumatoid arthritis, multiple sclerosis, Parkinson's, tauopathies) from healthy aging in systematic testing
  • Elastic net regression systematically excludes high-variance CpGs — precisely those most likely to reflect pathological biological aging — because their variability increases residuals during training
  • Rectifying incoherence improved discrimination between healthy individuals and patient populations and reduced neutrophil/leukocyte fraction skew, but reduced chronological age prediction accuracy
  • Clock residuals ('age acceleration') of under ±10 years fall within normal biological variation or random noise, undermining their use as biomarkers of intervention efficacy
  • The PACE clock, despite being trained on disease-risk scores rather than chronological age, still functioned primarily as a chronological age proxy and failed to reliably detect inflammaging

Metodología

Se trata de una comunicación breve que combina análisis teórico, reanálisis de modelos de reloj existentes y simulaciones ilustrativas con conjuntos de datos hipotéticos de CpG. Los autores cuantificaron la incoherencia entre múltiples relojes de metilación del DNA publicados comparando el signo del coeficiente del modelo de cada CpG seleccionado con la dirección de su correlación univariante con la edad, calculando tanto el porcentaje de características incoherentes como su contribución proporcional al peso total del modelo. Se utilizaron conjuntos de datos de CpG simulados para demostrar cómo se comporta la regresión elastic net en condiciones de colinealidad y varianza típicas de los datos de envejecimiento biológico. No se recopilaron datos de nuevas cohortes humanas; el artículo se basa en razonamiento analítico y en el reanálisis de arquitecturas de relojes publicadas.

Limitaciones del estudio

Se trata de una breve comunicación rápida sin nuevos datos experimentales ni validación en cohortes humanas; las conclusiones se apoyan en un análisis teórico y computacional de modelos de relojes existentes. Los autores no presentan un reloj alternativo completamente validado, sino únicamente una prueba de concepto que demuestra que corregir la incoherencia mejora la discriminación biológica a costa de la precisión en la edad cronológica. No se declaran conflictos de interés; la financiación provino de NIH (R01AG071787) y CDMRP (TX230133), ambas concedidas a la autora principal Irina Conboy.

¿Te ha gustado este resumen?

Recibe la última investigación sobre longevidad en tu bandeja de entrada cada semana.

Introduce tu correo electrónico para suscribirte: