El software, parte de la apuesta de Microsoft de casi 19 mil millones de dólares en Nuance Communications y el futuro de la inteligencia artificial en la atención médica, promete generar notas en segundos, pero la precisión, la responsabilidad e incluso problemas como la forma en que se formatea la nota pueden hacer que algunos médicos se opongan.

La mayoría de los médicos te dirán que eligieron su profesión porque quieren ayudar a la gente. Pero, frustrantemente, muchos pasan horas detrás de pantallas en lugar de estar con los pacientes, ingresando numerosos detalles en los registros médicos que a menudo les obligan a trabajar hasta altas horas de la noche.

Entre las regulaciones gubernamentales y los requisitos de los seguros, rellenar estos detalles no es opcional, pero supone una pesada carga emocional encima de una profesión ya de por sí estresante.

“Los médicos odian absolutamente las cargas administrativas de la medicina”, dice Scott Smitherman, médico internista y director médico de información de atención ambulatoria en el sistema de salud Providence. “Ese es uno de los mayores factores que contribuyen al agotamiento”.

Durante los últimos años, Smitherman ha estado probando una tecnología que tiene el potencial de aliviar parte de la carga: una aplicación que registra las interacciones de los médicos con los pacientes y utiliza inteligencia artificial para generar notas para el registro médico. La aplicación, llamada Dragon Ambient eXperience o DAX, fue desarrollada por Nuance Communications, la compañía de inteligencia artificial que Microsoft adquirió por 18.800 millones de dólares en 2022. Si bien muchos de los 430 médicos en Providence que utilizan DAX hasta ahora les gusta, Smitherman dice que ha habido dos obstáculos principales cuando se trata de convencer a más médicos de que lo usen: “resistencia al cambio” y “renunciar al control” de la escritura de notas, por mucho que lo detesten.

Ilustración de Yunjia Yuan, para Forbes.

Hasta ahora, ha habido un revisor humano de calidad que verifica el trabajo de la inteligencia artificial antes de que se envíe al médico para su revisión final. Pero este verano, Microsoft y Nuance comenzarán a implementar una versión completamente automatizada que incorpora GPT-4 gracias a la alianza de Microsoft con OpenAI.

El gigante del software espera que la versión completamente automatizada, que genera la nota en cuestión de segundos, se expanda mucho más rápido que la versión anterior. Pero la verdadera pregunta para el éxito es: ¿los médicos cederán el control a máquinas imperfectas para recuperar unos pocos minutos de su vida? Y los expertos dicen que las preocupaciones sobre la precisión, la responsabilidad e incluso problemas como la forma en que se formatean las notas pueden hacer que algunos médicos duden en utilizar la inversión multimillonaria de Microsoft.

“¿En 20 años? Sí, creo que la gran mayoría de los médicos van a hacer toda su documentación utilizando este tipo de software”, dice Alex Lennox-Miller, analista principal de TI sanitaria en CB Insights. “¿En cinco años? No”.

Siga aquí nuestra cobertura especializada en inteligencia artificial

La posibilidad de una larga curva de adopción no significa necesariamente que DAX sea un fracaso para Microsoft. Por un lado, tiene una ventaja de confianza sobre los competidores actuales y futuros: alrededor de 550 000 médicos ya utilizan el software de dictado médico de Nuance. Y este impulso hacia la automatización total es un paso incremental pero importante en las ambiciones más amplias de Microsoft de desarrollar y vender nuevos productos en ese punto de apoyo existente de aproximadamente la mitad de todos los médicos en los Estados Unidos cuando el CEO de Microsoft, Satya Nadella, anunció por primera vez la adquisición de Nuance, describió un futuro Oportunidad de mercado de US$500.000 millones: “La IA es la prioridad más importante de la tecnología”, dijo, “y la atención médica es su aplicación más urgente”.


La necesidad de velocidad

Nuance estima que el médico promedio dedica alrededor de 15 minutos a la documentación por visita del paciente y que su software con el revisor de calidad humana ayuda a reducir alrededor de siete minutos. El revisor ayudó a garantizar la precisión de la nota generada por IA, pero hubo un gran inconveniente: un retraso de hasta cuatro horas. Con esta nueva iteración, Nuance dice que las notas del paciente pueden estar listas en segundos. El plan es comenzar con la atención primaria e implementar la nueva versión para alrededor de 500 médicos este verano.

“Ahora que tenemos algo completamente automatizado, esto comenzará a escalar incluso más rápido de lo que hemos visto en los últimos tres años”, dice Kenneth Harper, vicepresidente de DAX en Nuance.

Pero la velocidad puede no importar si los médicos tienen que regresar constantemente y verificar el trabajo del software. Y tendrán que hacerlo, ya que tienen la responsabilidad legal final por el contenido de los registros médicos de un paciente. Microsoft y Nuance dicen que la incorporación de GPT-4 mejora la precisión general de los modelos de IA, pero no revela una tasa de precisión. Una demostración de tecnología observada por Forbes encontró un error en las notas resultantes: la IA escribió que el dolor de espalda de la paciente comenzó a los 50 años, cuando durante el examen dijo que el dolor había comenzado a los 20 años.

Foto: Microsoft.

“Siempre existe la posibilidad de error con un sistema de IA, estas cosas nunca serán 100 % precisas”, dice Harper. “Le estamos ahorrando tiempo, sin embargo, el médico sigue siendo el responsable final de revisar la nota”.

Siempre ha sido así, dice Hal Baker, médico de atención primaria y director digital y de información de WellSpan Health, ya sea que usen un escriba humano, software o escriban a mano sus notas. “Si sale algo mal, está bien, lo corrijo”, dice sobre el uso de DAX. “A veces es más fácil corregir la escritura de otra persona que corregir la tuya”. Pero diferentes médicos tendrán diferentes tolerancias al riesgo.

Otras preocupaciones sobre la precisión involucran el entorno en el que se usa la herramienta. Por ahora, la tecnología se puede usar en un entorno de sala de examen. Un desafío futuro es si funcionará en entornos más frenéticos, como las salas de emergencia de los hospitales, donde hay muchas más voces y otras distracciones.

Otra preocupación es la diversidad de poblaciones de pacientes que los médicos ven todos los días y cómo estos modelos funcionarán en diferentes acentos o hablantes no nativos de inglés. Harper dice que los modelos de Nuance han sido entrenados en 8 millones de visitas de pacientes en todo Estados Unidos. El software está construido actualmente para “U.S. inglés”, pero Nuance planea expandirse a encuentros en idiomas mixtos, como español e inglés.

Uno de los pasos clave para introducir la inteligencia artificial ambiental en entornos de atención médica es validar los modelos en diferentes poblaciones y comprender y comunicar las limitaciones de la tecnología, dice Nicole Martinez-Martin, profesora asistente en el Centro de Ética Biomédica de Stanford. “Ya hay muchas formas en que el sistema médico no es equitativo”, dice ella. “Trata a los grupos de bajos ingresos, a las personas de diferentes razas de manera diferente y esta puede ser un área adicional que exacerba eso”.

¿Una talla le queda a la mayoría?

Uno de los grandes obstáculos para lograr que los médicos usen DAX será un cambio cultural en términos de lo que se puede perder cuando las máquinas toman el control de la escritura. Si bien las notas médicas tienen los mismos componentes (el problema principal del paciente, el historial médico, las recetas, el examen y el plan de seguimiento), la forma en que se escriben puede variar mucho de un médico a otro. “Para una persona es demasiado largo, para otra es demasiado corto”, dice Baker. “Porque algo de esto es estilísticamente cómo documentamos y cómo tratamos de escribir la historia y hay una gran variabilidad de eso”.

En la versión de DAX con el revisor humano en el circuito, ha habido oportunidad para cierta personalización. Por ejemplo, el revisor humano puede extraer información de registros médicos anteriores en función de las preferencias del médico, como los resultados de las pruebas de laboratorio o el historial del paciente, en la nueva nota. En el sistema hospitalario de Baker en Pensilvania, alrededor de 230 médicos que utilizan el software generan 25 000 notas al mes. Dijo que DAX redujo el precio de una nota a alrededor de US$ 6.23 en enero, que era significativamente más barato que usar un escriba médico humano. (Microsoft y Nuance se negaron a comentar sobre el precio por persona). Baker dice que espera que la versión express totalmente automatizada sea más “talla única”, pero reconoce que es un paso necesario para tratar de reducir los costos.

Por el momento, Microsoft y Nuance planean continuar ofreciendo ambas versiones a los clientes: revisadas por humanos y completamente automatizadas. Pero el siguiente paso será descubrir cómo hacer que la versión automatizada sea más personalizada. Harper dice que esto comienza con el desarrollo de diferentes plantillas estilísticas entre las que los médicos pueden elegir, por ejemplo, una “opción detallada versus sucinta”, cuando se trata de la longitud y la cantidad de información incluida en la nota. Nuance también trabajará para automatizar otras funciones que actualmente realiza el revisor humano, como extraer información de notas anteriores.

Si bien el enfoque principal hasta ahora ha sido documentar la nota correctamente, Harper dice que el futuro incluirá características, como preparar pedidos, recomendar diagnósticos y generar instrucciones para el paciente después de la visita, lo que significa que el software va más allá de la toma de notas y se convierte en más de un asistente de flujo de trabajo. “Tiene que venir con control. Hay que hacerlo con responsabilidad”, dice. “Pero ciertamente no se detendrá con la documentación, hará mucho más”.

Es en los próximos meses y años, a medida que más médicos comiencen a usar el DAX completamente automatizado, que los hospitales realmente comenzarán a comprender si la IA realmente puede aliviar las cargas administrativas que agotan a sus médicos. Pero los primeros usuarios como Baker son optimistas sobre el futuro.

“Te permite simplemente escuchar y pensar en el paciente”, dice. “Subestimé cuánto alivio iba a ser”.

Siga la información de tecnología en nuestra sección especializada