Como médico en Nigeria, Tobi Olatunji conoce el estrés de ejercer en los ajetreados hospitales de África. Como científico de aprendizaje automático, tiene una receta para ello.
“Trabajé en uno de los hospitales más grandes de África occidental, donde habitualmente atendía a más de 30 pacientes al día; es un trabajo muy duro”, dijo Olatunji.
La necesidad de escribir notas detalladas para el paciente y completar formularios lo hace aún más difícil. Los registros en papel también redujeron el ritmo de la investigación médica.
En sus primeros años de práctica, Olatunji imaginó un programa para abrirse camino entre los montones de papeleo, liberando a los médicos para ayudar a más pacientes.
Ha sido un viaje, pero ese software program está disponible hoy en su empresa, Salud del intrónmiembro de la Inicio de NVIDIA programa, que nutre nuevas empresas de vanguardia.
Un viaje lateral en tecnología
Con el apoyo de los mentores de la escuela de medicina, Olatunji obtuvo una maestría en informática médica de la Universidad de San Francisco y otra en ciencias de la computación en Georgia Tech. Comenzó a trabajar como científico de aprendizaje automático en los EE. UU. durante el día y a escribir código durante las noches y los fines de semana para ayudar a digitalizar los hospitales de África.
Una prueba piloto durante la pandemia tuvo un inconveniente.
Los primeros médicos que usaron el código tardaron 45 minutos en terminar las notas de sus pacientes. Sintiéndose incómodos frente a un teclado, algunos trabajadores de la salud dijeron que prefieren lápiz y papel.
“Tomamos la difícil decisión de invertir en el procesamiento del lenguaje pure y el reconocimiento del habla”, dijo. Es una tecnología con la que ya estaba familiarizado en su trabajo diario.
Construcción de modelos de IA
“La combinación de terminología médica y fuertes acentos africanos produjo resultados horribles con la mayoría de los programas de voz a texto existentes, por lo que sabíamos que no habría atajos para entrenar a nuestros propios modelos”, dijo.
El equipo de Intron evaluó varios marcos de reconocimiento de voz comerciales y de código abierto y grandes modelos de lenguaje antes de elegir construir con Nvidia Nemoun marco de software program para aplicaciones basadas en texto IA generativa. Además, los modelos resultantes fueron entrenados en GPU NVIDIA en la nube.
“Inicialmente tratamos de entrenar con CPU como la opción más económica, pero tomó una eternidad, por lo que comenzamos con una sola GPU y finalmente llegamos a usar varias de ellas en la nube”, dijo.
La aplicación Transcribe resultante captura los mensajes dictados por los médicos con más del 92 % de precisión en más de 200 acentos africanos. Cut back el tiempo que dedican al papeleo en un promedio de 6 veces, según un estudio en curso que Intron está realizando en hospitales de cuatro países africanos.
“Incluso el médico con las habilidades de escritura más rápidas en el estudio obtuvo una aceleración del 40%”, dijo sobre el software program que ahora se usa en varios hospitales de África.
Escuchando las voces de África
Olatunji sabía que sus modelos necesitaban datos de audio de alta calidad. Entonces, la compañía creó una aplicación para capturar fragmentos de términos médicos hablados en diferentes acentos.
Hasta la fecha, la aplicación ha recopilado más de un millón de clips de más de 7000 personas en 24 países, incluidas 13 naciones africanas. Es uno de los conjuntos de datos más grandes de su tipo, partes de las cuales se han publicado como código abierto para apoyar la investigación del habla africana.
Hoy, Intron actualiza sus modelos cada dos meses a medida que ingresan más datos.
Fomentando la diversidad en Medtech
Existe muy poca investigación sobre el reconocimiento de voz para acentos africanos en un entorno clínico. Entonces, trabajar con las comunidades tecnológicas de África como DSN, Masakhane y ZindiIntrón lanzado AfriDiscurso-200un desafío para desarrolladores para impulsar la investigación utilizando sus datos.
Del mismo modo, a pesar de toda su sofisticación, la tecnología médica está rezagada en diversidad e inclusión, por lo que Olatunji lanzó recientemente un esfuerzo que también aborda ese problema.
Laboratorio Bio-RAMP es una comunidad world de investigadores de minorías que trabajan en problemas que les preocupan en la intersección de la IA y la atención médica. El grupo ya tiene media docena de artículos bajo revisión en las principales conferencias.
“Durante siete años, fui la única persona negra en todos los equipos en los que trabajé”, dijo. “No había científicos ni gerentes negros, ni siquiera en mis entrevistas de trabajo”.
Mientras tanto, Intron incluso está ayudando a los hospitales de África a encontrar formas creativas de adquirir el {hardware} que necesitan. Es otro desafío en el camino hacia la apertura de grandes oportunidades.
“Una vez que los datos de atención médica se digitalizan, abre un mundo completamente nuevo para la investigación en áreas como modelos predictivos que pueden ser sistemas de alerta temprana para epidemias; no podemos hacerlo sin datos”, dijo Olatunji.
Mirar una clase magistral (a partir de las 20:30) con Olatunji, HuggingFace y NVIDIA sobre IA para reconocimiento de voz.