IA y Estadística en la investigación médica: ¿aliadas o adversarias?

Por Dr. Reimer Romero Hernández

Investigador Asociado la IIMBUC 

Instituto de Investigaciones Médicas y Biotecnológias de la Universidad de Carabobo

Desde que Apple introdujo a su  "asistente virtual" Siri en los dispositivos iOS hace 12 años, se inició la era comercial de las inteligencias artificiales (IA), con empresas como OpenAI y Google a la cabeza. Sin embargo, la historia de la IA es mucho más antigua, y mientras las investigaciones en el área de las ciencias médicas apoyadas en IA continúan desarrollándose, aún queda  camino por recorrer en cuanto a aplicaciones prácticas en el ámbito de la salud. Surgen muchas dudas y precauciones ante temas tan delicados, como por ejemplo, el uso público de datos biomédicos.

No obstante, esta situación brinda la oportunidad de explorar el potencial de esta tecnología y su relación con las herramientas estadísticas tradicionales. El artículo publicado en The New England Journal of Medicine, titulado 'Where Medical Statistics Meets Artificial Intelligence', analiza la intersección entre la estadística médica y la inteligencia artificial, destacando tanto las oportunidades como los desafíos que cada disciplina presenta en el análisis de datos biomédicos. A continuación, presentaré los aspectos que considero más relevantes de dicho artículo.

La Inteligencia Artifical: la salud no es artificial.

En el siglo XXI, la inteligencia artificial (IA) se ha convertido en una herramienta fundamental en la ciencia de datos y está influyendo cada vez más en la investigación médica,4-6 con innovaciones que ocurren a un ritmo rápido. Este avance se ve impulsado en parte por el gran aumento de las capacidades informáticas y la accesibilidad de los datos. No obstante, los mismos rasgos que hacen de la IA un activo invaluable para el análisis de datos también la exponen a vulnerabilidades desde un punto de vista estadístico. Esta contradicción es especialmente pertinente en el campo de la ciencia médica. Los métodos que funcionan bien para la publicidad dirigida a los consumidores o para mejorar las predicciones meteorológicas pueden no cumplir con los estrictos requisitos necesarios para evaluar o diagnosticar riesgos médicos. 
 
Esquema de la gestión de la información de una IA médica. Figura tomada de [1]
 

 Alcances de la IA

La IA ha revolucionado el análisis de datos gracias a su capacidad para manejar grandes volúmenes de información y extraer características complejas automáticamente. Esto es especialmente útil en campos como la imagenología médica y el análisis genómico, donde se pueden identificar patrones que serían difíciles de discernir mediante métodos estadísticos tradicionales. Las técnicas de aprendizaje automático permiten:

Predicción a gran escala: La IA es eficaz para tareas de predicción, como evaluar el riesgo de enfermedades, utilizando grandes conjuntos de datos etiquetados.
 
- Reducción de dimensionalidad: Algoritmos como los bosques aleatorios y XGBoost pueden reducir un gran número de variables a un conjunto más manejable, facilitando el análisis posterior con métodos estadísticos convencionales.

Sin embargo, esta flexibilidad también presenta desafíos significativos.
 

Limitaciones de la IA

A pesar de sus ventajas, la IA enfrenta varias limitaciones:

- Interpretabilidad: Los modelos de IA a menudo operan como "cajas negras", lo que dificulta entender cómo se toman las decisiones. Esto puede generar problemas en la auditoría y replicación de resultados.

- Generalizabilidad: La capacidad de un modelo para hacer inferencias sobre una población más amplia a partir de datos individuales es limitada. La IA se centra más en la predicción que en la inferencia poblacional, lo que puede llevar a conclusiones erróneas sobre mecanismos biológicos o terapias efectivas.

- Sobreajuste: La complejidad inherente a los modelos de IA puede resultar en un sobreajuste a los datos de entrenamiento, comprometiendo su rendimiento en nuevos conjuntos de datos.

La estadística o bioestadística

La estadística, emergió a comienzos del siglo XX, desarrolló conceptos fundamentales, incluido el uso de la aleatorización en ensayos clínicos, las pruebas de hipótesis, la inferencia basada en la probabilidad, los valores P, el análisis bayesiano y la teoría de la decisión. Así logró convertirse en un componente fundamental de las ciencias aplicadas, alcanzando tal significación que en el año 2000, el consejo editorial de una prestigiosa revista (Application of Statistics to Medicine”) la declaró como uno de los once desarrollos más innovadores en el ámbito de la ciencia médica a lo largo del último milenio. La estadística se compromete fundamentalmente con el proceso de razonamiento bajo condiciones de información incompleta y se dedica a la interpretación meticulosa y comunicación efectiva de descubrimientos científicos que se basan en datos empíricos. El campo de la estadística abarca una amplia gama de actividades, incluyendo la determinación cuidadosa de los diseños experimentales más efectivos y la cuantificación precisa de la incertidumbre respecto a las conclusiones y afirmaciones inferenciales que surgen del análisis de datos, todos los cuales se articulan a través del sofisticado y matizado lenguaje de la probabilidad.

 

Esquema de la gestión de la información en la estadística médica. Figura tomada de [1]

 

Alcances de la Estadística

La estadística proporciona un marco riguroso para el diseño experimental y la interpretación de datos. Sus principales contribuciones incluyen:

- Inferencia poblacional: A diferencia de la IA, la estadística está diseñada para hacer inferencias sobre poblaciones a partir de muestras, utilizando métodos bien establecidos como los intervalos de confianza y los valores p.

- Diseño experimental: Los estadísticos pueden especificar hipótesis y métodos antes del análisis, lo que ayuda a evitar sesgos y sobreinterpretaciones.
 

Limitaciones de la Estadística

Sin embargo, la estadística también tiene sus limitaciones:

- Escalabilidad: Los métodos estadísticos tradicionales pueden ser difíciles de aplicar a conjuntos de datos extremadamente grandes o complejos, donde la IA podría ser más efectiva.

- Dependencia del juicio experto: La selección manual de características puede ser limitada por el conocimiento del analista, lo que puede llevar a omisiones importantes en el análisis.

La validez de las conclusiones

Como hemos visto, tanto la IA como la estadística tienen roles complementarios en el análisis biomédico. Mientras que la IA ofrece herramientas poderosas para manejar y predecir con grandes volúmenes de datos, la estadística proporciona un marco sólido para interpretar esos datos con rigor científico. La combinación cuidadosa de ambas disciplinas es esencial para avanzar en la investigación médica y garantizar que las conclusiones sean válidas y aplicables a poblaciones más amplias.

Referencia:

[1] Hunter DJ, Holmes C. Where Medical Statistics Meets Artificial Intelligence. The New England Journal of Medicine. 2023 Sep 28;389(13):1211–9. https://statmodeling.stat.columbia.edu/wp-content/uploads/2023/10/Hunter-2023.pdf


Comentarios

Entradas populares de este blog

Forma corporal y el riesgo de desarrollar cáncer

Humboldt, Miranda y la anguila eléctrica