Minería de Textos para Clasificación y Análisis de Sentimientos de Relatos Personales

  • Adriana Soledad Ruiz Diaz Departamento de Posgrados, Universidad CAECE, Mar del Plata
  • Miguel Mendez Garabetti Free and Open Source Software/Hardware Research Laboratory (FOSSHLab), Argentina
Palabras clave: Minería de Textos, Aprendizaje Automático, Clasificación, Análisis de Sentimientos

Resumen

El presente trabajo busca implementar herramientas y técnicas de aprendizaje automático para automatizar el proceso de análisis de los relatos recopilados en tres ediciones del libro "Matilda y las Mujeres en Ingeniería en América Latina", con el fin de identificar factores que influyen en la elección y ejercicio de la carrera de ingeniería por parte de las mujeres. La metodología seguirá los lineamientos propuestos para un proceso de Descubrimiento de Conocimiento en Textos (KDT). El trabajo se dividirá en varias etapas: comprensión del dominio de aplicación, extracción de datos, limpieza, procesamiento y transformación de datos, y desarrollo del modelo. En la actualidad, el proyecto se encuentra en la fase de construcción del corpus y supresión de patrones de información no significativos. Luego se realizará una tokenización del texto para entender las características del mismo y se evaluará la técnica más adecuada para cuantificar el set de palabras presentes en el corpus. Se construirá un modelo de aprendizaje automático supervisado para predecir la temática principal del relato y se analizará el sentimiento del mismo en función de su temática. El análisis de sentimientos se realizará considerando el sentimiento como la suma de los sentimientos de cada una de las palabras que lo conforman.

Publicado
2023-07-10
Cómo citar
Ruiz Diaz, A., & Mendez Garabetti, M. (2023). Minería de Textos para Clasificación y Análisis de Sentimientos de Relatos Personales. Memorias De Las JAIIO, 9(1). Recuperado a partir de https://publicaciones.sadio.org.ar/index.php/JAIIO/article/view/662
Sección
AGRANDA - Simposio Argentino de Ciencia de Datos y GRANdes DAtos