Desarrollo y análisis de sesgos de un modelo de desidentificación de historias clínicas electrónicas en español

Palabras clave: Historia clínica electrónica, anonimización, sesgos

Resumen

Los registros de salud provenientes de historias clínicas electrónicas (HCE) son una fuente valiosa de información para múltiples usos secundarios de investigación, planeamiento, etc. Sin embargo, son datos sensibles y se encuentran legalmente protegidos por su potencial impacto en derechos fundamentales, como el derecho a la intimidad o a la no discriminación (por ej. en el acceso al mercado de trabajo).

Por ello, para adecuar los registros de salud a un uso secundario, resulta imprescindible aplicar procesos que eliminen aquella información que permita identificar al titular de los datos (desidentificación).

En este trabajo presentamos una prueba de factibilidad de la desidentificación automática de texto libre en HCE. Se analizó una aproximación a la tarea, con especial atención a los potenciales sesgos en su funcionamiento, que pueden resultar en comportamientos discriminatorios. Teniendo en cuenta las particularidades de los datos: homogeneidad, heterogeneidad y proporción de entidades identificatorias, se aplicaron las métricas: Treatment Equality, Equal Opportunity, Equalized Odds y Conditional Use Accuracy Equality, para analizar la existencia de sesgos producidos por el modelo.

Publicado
2023-07-11
Cómo citar
Rajngewerc, M., López, S., Silvi, L., Ación, L., & Alonso Alemany, L. (2023). Desarrollo y análisis de sesgos de un modelo de desidentificación de historias clínicas electrónicas en español. Memorias De Las JAIIO, 9(5), 102-107. Recuperado a partir de https://publicaciones.sadio.org.ar/index.php/JAIIO/article/view/554
Sección
CAIS - Congreso Argentino de Informática y Salud