Un equipo de investigación de Google Health explica, en un estudio publicado en la revista Nature, cómo han logrado crear una IA para la detección de cáncer de mama de manera temprana. Según los investigadores, la IA es capaz de superar a los expertos humanos incluso, ya que la comparación con ellos en cuanto a falsos positivos y falsos negativos es menor.
El algoritmo se entrenó con 76,000 mamografías de mujeres británicas y 15,000 de mujeres estadounidenses. Luego, la IA detectó la enfermedad en mamografías de mujeres a las que ya se les había confirmado el cáncer de mama por medio de biopsias o imágenes de seguimiento. Los resultados que arrojó el estudio son bastante positivos, sin embargo, los mismos investigadores recuerdan que estos resultados de laboratorio podrían no presentarse de la misma manera en entornos reales.
“…mostramos una reducción absoluta del 5,7% y 1,2% (Estados Unidos y Reino Unido) en falsos positivos y de un 9,4% y 2,7% en falsos negativos”. Asimismo, “en un estudio independiente de seis radiólogos, el sistema de IA superó a todos los lectores humanos.”
“El área bajo la curva característica operativa del receptor (AUC-ROC) para el sistema de IA fue mayor que el AUC-ROC para el radiólogo promedio por un margen absoluto del 11,5%.”
También se realizó una simulación en donde la IA participaba en el proceso de doble lectura que se utiliza en Reino Unido para la detección de cáncer (método usado para mejorar la tasa de acierto).
“…descubrimos que el sistema de inteligencia artificial mantenía un rendimiento no inferior y reducía la carga de trabajo del segundo lector en un 88%.”
A pesar de que los resultados de las pruebas en laboratorio indican que la IA es capaz de ayudar a la detección de cáncer de mama en etapas tempranas, los investigadores dicen que aún se necesitan ensayos clínicos que confirmen la utilidad de la herramienta.
“El mundo real es más complicado y potencialmente más diverso que el entorno de investigación controlado que se informa en este estudio.”
Otros factores que influyeron en la decisión de los investigadores de necesitar mayores pruebas para el correcto uso de la IA fueron que no se incluyeron todas las tecnologías de mamografía que existen en la actualidad, que la demografía de la población de estudio no estaba del todo definida y que a pesar de usar un filtro por edad, “el rendimiento de los algoritmos de IA puede depender en gran medida de la población utilizada en los conjuntos [de datos] de entrenamiento”
Además, se recordó que esta no sería la primera vez que un sistema de este tipo tiene resultados prometedores en laboratorio y después no funciona adecuadamente en entornos reales.