Memorias de las JAIIO https://publicaciones.sadio.org.ar/index.php/JAIIO <p>La publicación <em><strong>Memorias de las JAIIO</strong></em>&nbsp; (ISSN 2451-7496) recopila los trabajos presentados en las Jornadas Argentinas de Informática (JAIIO), que&nbsp;se realizan desde 1961, organizadas por la&nbsp;<a href="http://sadio.org.ar/">Sociedad Argentina de Informática</a>&nbsp;(SADIO).&nbsp;Las JAIIOs&nbsp;<strong>r</strong>eúnen miembros provenientes de la academia, la industria y el gobierno, tanto argentinos como del extranjero., con el objetivo de extender el conocimiento de la disciplina informática, estimular los vínculos entre los profesionales y promover la enseñanza y la investigación en esta disciplina.&nbsp;Las JAIIOs se organizan como un conjunto de simposios, cada uno dedicado a un tema específico.</p> es-ES informacion@sadio.org.ar (Sociedad Argentina de Informática (SADIO)) informacion@sadio.org.ar (SADIO) Thu, 12 Oct 2023 16:20:45 +0000 OJS 3.1.1.4 http://blogs.law.harvard.edu/tech/rss 60 Nota Editorial https://publicaciones.sadio.org.ar/index.php/JAIIO/article/view/777 <p>AGRANDA (Simposio Argentino de Ciencia de Datos y GRANdes DAtos) reúne a representantes de los ámbitos académicos, estatales y de la industria vinculados con las distintas disciplinas, enfoques y aplicaciones de Ciencia de Datos, preferentemente relacionados con Big Data. Éstos incluyen minería y análisis de datos, descubrimiento del conocimiento, algoritmos, aplicaciones de inteligencia artificial, gobierno de datos y arquitecturas para grandes datos, entre otros.</p> <p>&nbsp;En el contexto de AGRANDA se promueve la participación de docentes, investigadores, profesionales y empresas a contribuir con artículos en el formato tradicional de los trabajos de investigación, estudios de nuevas aplicaciones y casos de estudio, presentación de nuevas herramientas, informes de actividades de transferencia o reportes de experiencias prácticas relacionadas a las temáticas del simposio.</p> Cecilia Ruz, Manuela Cerdeiro, Pablo Turjanski ##submission.copyrightStatement## https://publicaciones.sadio.org.ar/index.php/JAIIO/article/view/777 Thu, 12 Oct 2023 00:00:00 +0000 Predicción de la satisfacción del usuario a partir de chats de atención al cliente https://publicaciones.sadio.org.ar/index.php/JAIIO/article/view/668 <p><span style="font-weight: 400;">Los servicios de atención al cliente son determinantes de la experiencia de usuario de las empresas Fintech. Este trabajo busca entender, empleando técnicas de machine learning, qué factores llevan a los clientes de una Fintech a evaluar de forma positiva su experiencia. Esto se hizo a partir de dos fuentes de datos: los registros de los usuarios y las conversaciones del servicio de atención al cliente vía WhatsApp. Experimentamos con modelos predictivos basados en XGBoost, entrenados con features del contexto del usuario, las características de las conversaciones y la semántica de las palabras utilizadas en las conversaciones. Los resultados fueron menores a lo esperado (AUC = 0.5152), pero dejan aprendizajes valiosos para quienes encaren problemas semejantes en el futuro, relacionados a los desafíos de los siguientes aspectos críticos: i. evitar el data leakage, ii. evaluar modelos y scoring metrics exhaustivamente, iii. realizar chequeos intermedios, iv. no subestimar el tiempo necesario para la transformación de datos, v. realizar un proceso de unit testing y vi. conocer el dominio. Este trabajo describe las distintas etapas de la metodología: extracción y transformación de los datos, generación de features, entrenamiento de modelos predictivos, selección del modelo óptimo y evaluación en datos de test.</span></p> Alejandro Romanisio, Agustín Gravano ##submission.copyrightStatement## https://publicaciones.sadio.org.ar/index.php/JAIIO/article/view/668 Mon, 10 Jul 2023 13:46:33 +0000 Cuantificando la organización social a través del procesamiento del lenguaje natural https://publicaciones.sadio.org.ar/index.php/JAIIO/article/view/748 <p>El debate sobre la integración y fragmentación social en las plataformas de redes sociales online sigue en curso. El desplazamiento de los usuarios hacia extremos ideológicos y agrupamiento en ``cámaras de eco"&nbsp; homogéneas son preocupantes. Waller et al.&nbsp; recientemente desarrollaron un método para cuantificar el posicionamiento de las comunidades en Reddit a lo largo de las dimensiones sociales en base a la concurrencia de usuarios en distintas comunidades. Utilizaron embeddings de comunidades para proyectarlas en direcciones unidimensionales que representan ``dimensiones ideológicas", obteniendo puntajes o scores que posicionan a cada comunidad en el espectro político-ideológico.</p> <p>Proponemos desarrollar una técnica análoga pero utilizando el texto de los posteos y comentarios de los subreddits en lugar de las interacciones. La hipótesis es que las jergas, tópicos y formas discursivas de cada comunidad permiten cuantificar muchos de sus aspectos ideológicos de forma similar a sus interacciones.<br>Utilizamos Fasttext y LLMs para estimar diferentes tipos de embeddings de texto y RBO para comparar los resultados obtenidos.<br>Los resultados preliminares sugieren que existe una relación estadísticamente significativa entre los scores obtenidos y los reportados en el trabajo de Waller et al., lo que podría señalar la existencia de jergas propias de las comunidades que permiten cuantificar su posicionamiento ideológico.</p> Franco Demarco, Juan Manuel Ortiz de Zarate, Esteban Feuerstein ##submission.copyrightStatement## https://publicaciones.sadio.org.ar/index.php/JAIIO/article/view/748 Fri, 21 Jul 2023 20:30:25 +0000 Minería de Textos para Clasificación y Análisis de Sentimientos de Relatos Personales https://publicaciones.sadio.org.ar/index.php/JAIIO/article/view/662 <p>El presente trabajo busca implementar herramientas y técnicas de aprendizaje automático para automatizar el proceso de análisis de los relatos recopilados en tres ediciones del libro "Matilda y las Mujeres en Ingeniería en América Latina", con el fin de identificar factores que influyen en la elección y ejercicio de la carrera de ingeniería por parte de las mujeres. La metodología seguirá los lineamientos propuestos para un proceso de Descubrimiento de Conocimiento en Textos (KDT). El trabajo se dividirá en varias etapas: comprensión del dominio de aplicación, extracción de datos, limpieza, procesamiento y transformación de datos, y desarrollo del modelo. En la actualidad, el proyecto se encuentra en la fase de construcción del corpus y supresión de patrones de información no significativos. Luego se realizará una tokenización del texto para entender las características del mismo y se evaluará la técnica más adecuada para cuantificar el set de palabras presentes en el corpus. Se construirá un modelo de aprendizaje automático supervisado para predecir la temática principal del relato y se analizará el sentimiento del mismo en función de su temática. El análisis de sentimientos se realizará considerando el sentimiento como la suma de los sentimientos de cada una de las palabras que lo conforman.</p> Adriana Soledad Ruiz Diaz, Miguel Mendez Garabetti ##submission.copyrightStatement## https://publicaciones.sadio.org.ar/index.php/JAIIO/article/view/662 Mon, 10 Jul 2023 11:56:17 +0000 Identificación de Diferencias y Similitudes Estructurales en las Redes Interindustriales de Empleo de Argentina https://publicaciones.sadio.org.ar/index.php/JAIIO/article/view/616 <p>La movilidad del empleo entre industrias refleja relaciones entre actividades económicas que se representan naturalmente como redes que resaltan las propiedades de conectividad entre sectores económicos. Los flujos de empleo varían en el tiempo tanto por factores coyunturales como estructurales. Usando registros administrativos de Argentina para el período 1996-2020, exploramos las redes interindustriales y caracterizamos sus estructuras y dinámicas a cuatro dígitos de clasificación de actividades CIIU. Analizamos las transiciones interanuales de empleo entre casi 300 actividades económicas y encontramos redes de elevada conectividad con propiedades de mundo pequeño, cuya estructura cambia en el tiempo. ¿Cuán distintas son las estructuras subyacentes de intercambios interindustriales de empleo? ¿Es posible caracterizar conexiones estables y cambios significativos a lo largo del tiempo? Aplicando métricas y mediciones de similitud estructural para cuantificar las diferencias en las redes interanuales encontramos que es posible identificar distintos regímenes de conectividad que correlacionan con períodos de cierta estabilidad macroeconómica, a la vez que se detectan períodos transicionales en los que estas estructuras van cambiando entre regímenes.</p> Sergio Andrés De Raco, Viktoriya Semeshenko ##submission.copyrightStatement## https://publicaciones.sadio.org.ar/index.php/JAIIO/article/view/616 Fri, 07 Jul 2023 20:57:30 +0000 Characterizing Community Structures on Social Media Over Time: A Graph Learning Approach https://publicaciones.sadio.org.ar/index.php/JAIIO/article/view/754 <p>Abstract. In an age where information is more accessible than ever, it’s easy to assume that people are becoming more informed and open-minded. In spite of that, people are increasingly finding themselves in echo chambers, surrounded by like-minded individuals and exposed mainly to content that reinforces their existing beliefs. There are, however, social media users that break with that pattern by changing the group of users they interact with over time. In this study, we analyze the dynamics of interactions between users on Twitter and Reddit over extended periods, with the aim of identifying changes in community structures. We leverage the data available through these platforms’ APIs to construct user interaction graphs and use several methods to classify users into communities, including SBM, Infomap and Louvain, to classify users into communities. Additionally, we use NLP techniques such as Community Pooling, BERTopic and Perspective, as well as graph algorithms, to characterize different user profiles in online debates. Our research analyzes how social media communities and their users evolve over time, with implications for understanding online discourse and facilitating healthy interactions on these platforms.<br>As a first approach, we analyzed three months of Donald Trump’s tweets, finding clear signs of polarization. Regarding the user flow between communities, we found that most of the users who changed communities twice went back to their original one (∼ 96%).</p> María Victoria Zolezzi, Federico Albanese, Esteban Feuerstein ##submission.copyrightStatement## https://publicaciones.sadio.org.ar/index.php/JAIIO/article/view/754 Mon, 24 Jul 2023 21:00:46 +0000 Redes sociales basadas en ubicación en Buenos Aires (2009-2015) https://publicaciones.sadio.org.ar/index.php/JAIIO/article/view/562 <table class="data" width="100%"> <tbody> <tr valign="top"> <td class="label">&nbsp;</td> <td class="value">El tipo de redes sociales que se basan en la ubicación de sus usuarios recibe el nombre de redes sociales basadas en localización (LBSN) y son un medio oportuno para el análisis del comportamiento espacio temporal de las personas. Utilizando datos registrados en Foursquare, aplicación para dispositivos móviles que provee a sus usuarios búsquedas personalizadas y localizadas, se construyó la red social de usuarios con actividades en lugares de la Ciudad Autónoma de Buenos Aires entre 2009 y 2015. En este trabajo se describen en primer lugar aspectos metodológicos para la recolección y procesamiento de datos de redes sociales utilizando información pública, y en segundo lugar se estudia las características estructurales de la red social que componen estos usuarios. Entre los hallazgos más importantes se encuentra una estructura fuertemente comunitaria, de mundo pequeño y con un grado neutral de afinidad selectiva, que no se enmarca en una distribución de grados de ley de potencias.</td> </tr> </tbody> </table> Leonardo Salvador Rocco, Marcelo A. Soria ##submission.copyrightStatement## https://publicaciones.sadio.org.ar/index.php/JAIIO/article/view/562 Wed, 05 Jul 2023 00:00:00 +0000 Quantifying Cultural Diversity in Social Networks: A Community Embedding Approach. https://publicaciones.sadio.org.ar/index.php/JAIIO/article/view/490 <div>The homophily phenomenon in social networks causes users to interact primarily with others who share their interests and cultural backgrounds,</div> <div>leading to the formation of "echo chambers".</div> <div>The notion of <em>cultural diversity</em>&nbsp;among users and communities becomes relevant in this context. While previous studies have investigated diversity in interaction graphs, to the best of our knowledge,</div> <div>none have explored the degree of diversity based on community embedding, which has been proven effective in measuring the positioning of communities in various social dimensions.</div> <div>Building on Waller's work "Quantifying social organization and political polarization in online platforms", we propose characterizing and measuring diversity through an innovative algorithm based on community embedding. We propose a novel algorithm based on community embedding to characterize and measure diversity. Our approach builds upon prior work on diversity in social media and involves iteratively updating values for the diversity of communities and individual users.</div> <div>To demonstrate the effectiveness of our algorithm, we conduct a case study analyzing over over 800 million posts in 9 million discussion subreddits of different ethnic groups on Reddit. Next, we generated embeddings for each community using community2vec and developed algorithms to quantify cultural diversity based on these embeddings.</div> <p><br><br></p> Abi Oppenheim, Federico Albanese, Esteban Feuerstein ##submission.copyrightStatement## https://publicaciones.sadio.org.ar/index.php/JAIIO/article/view/490 Fri, 07 Jul 2023 21:12:17 +0000 Modelo Cliente-Servidor sin Control de Estado para Aprendizaje Profundo de Datos en Dispositivos IoT Aplicados a Parámetros Ambientales https://publicaciones.sadio.org.ar/index.php/JAIIO/article/view/637 <p>El crecimiento exponencial de dispositivos IoT requiere de la investigación y desarrollo de nuevas arquitecturas para la gestión de protocolos de acceso a sensores, operaciones cliente servidor y el análisis de grandes volúmenes de datos con múltiples parámetros relacionados. El objetivo de este trabajo es investigar y proponer un modelo cliente-servidor, sin control de estado, para el acceso a sensores IoT, con brokers MQTT y arquitectura REST. El modelo agrupa por medio de análisis profundo los valores de concentración de CO2 (variable objetivo) de un lugar determinado, para luego correlacionar los resultados con los posibles efectos sobre la salud de las personas, a lo largo del tiempo. Los sensores son accesibles en tiempo real por medio de gateways GNSS (con acceso a redes celulares LTE-M1, WiFi mesh o Lorawan), monitoreados y gestionados con protocolos SNMP/Netconf [11]. La normalización de la variable se hace con datos ambientales externos obtenidos por geolocalización. Comparamos los resultados de K-NN. K-Means y GMM para el aprendizaje automático (supervisado y no supervisado) y asignación del grupo de riesgo del lugar para la variable concentración de CO2, en rangos de tiempo. Con la información obtenida se pueden realizar acciones de corrección (o alarma) sobre otros dispositivos controlados por IoT para regular la ventilación del lugar y su capacidad operativa.</p> Javier Adolfo Ouret, Luciano Parodi ##submission.copyrightStatement## https://publicaciones.sadio.org.ar/index.php/JAIIO/article/view/637 Fri, 07 Jul 2023 20:52:55 +0000 Reúso de un modelo de Aprendizaje Profundo para reconocimiento de dígitos manuscritos https://publicaciones.sadio.org.ar/index.php/JAIIO/article/view/669 <p>Las técnicas de Aprendizaje Automático (AA) han avanzado significativamente en la solución de diversos problemas, lo que ha llevado a una amplia difusión en su uso y desarrollo. Actualmente existen distintos modelos que han alcanzado un alto nivel de desempeño, lo que plantea la duda de qué hacer cuando nos enfrentamos a un problema para el cual ya existe un modelo muy eficiente. Desde hace tiempo esta situación ha impulsado la investigación y el desarrollo de diferentes técnicas para reutilizar estos modelos, en lugar de emprender el diseño, implementación y entrenamiento de uno nuevo, con todo el esfuerzo que ello conlleva. En este trabajo se presenta un problema de clasificación y se propone la reutilización de una red neuronal convolucional con el objetivo de reconocer números manuscritos. Asimismo, se ha evaluado el desempeño del modelo reutilizado.</p> Mauro José Pacchiotti, Luciana Ballejos, Mariel Ale ##submission.copyrightStatement## https://publicaciones.sadio.org.ar/index.php/JAIIO/article/view/669 Mon, 10 Jul 2023 15:04:14 +0000 Conferencia Invitada: AutoML: La serpiente que se muerde la cola https://publicaciones.sadio.org.ar/index.php/JAIIO/article/view/780 <p>Ingeniería y Ciencia de Datos para innovar la Ingeniería y Ciencia de Datos. Repaso sobre las nuevas formas de practicar la disciplina y cómo la IA vino a cambiar nuestra forma de encararlos</p> Ernesto Mislej ##submission.copyrightStatement## https://publicaciones.sadio.org.ar/index.php/JAIIO/article/view/780 Thu, 12 Oct 2023 00:00:00 +0000 Panel Invitado: Ciencia de Datos en el Estado, Oportunidades y Desafíos https://publicaciones.sadio.org.ar/index.php/JAIIO/article/view/782 <p>Nos encontramos inmersos en un entorno saturado de datos, donde el término "data driven" se encuentra en boca de todos, equiparando los datos al nuevo petróleo. En este panel, exploraremos en los desafíos y las oportunidades inherentes a esta realidad en el contexto de las entidades del Estado.</p> María Florencia Asef Horno, Melisa Breda, Maria del Rosario Bruera, Victoria Dumas, Mariana Kunst, Cecilia Ruz ##submission.copyrightStatement## https://publicaciones.sadio.org.ar/index.php/JAIIO/article/view/782 Thu, 12 Oct 2023 15:12:22 +0000 Conferencia Invitada: Implementación de Data Mesh en una organización https://publicaciones.sadio.org.ar/index.php/JAIIO/article/view/781 <p>En Mercado Libre tenemos una perspectiva “data-driven”. Valoramos las decisiones basadas en datos, clave para ser más competitivos y eficientes.</p> <p>Desde el equipo de Data &amp; Analytics, nuestro compromiso es colaborar activamente para que cada empleado en Mercado Libre pueda acceder a los datos y con ellos tomar las mejores decisiones. La evolución que hemos tenido a lo largo de estos años, en cuanto a tecnologías y cultura, nos permitió llevar el self-service a otro nivel, al punto inicial donde se generan los datos.</p> <p>Simplificando la tecnología, haciendo sencillo lo complejo, con governance y learning nuestros usuarios pueden producir, disponibilizar y compartir información con el resto de la organización a través de una estrategia Data Mesh sin conocimientos profundos de data engineering. En esta charla les contaremos nuestros desafíos, logros y lecciones aprendidas y hacia dónde vamos.</p> Adrián Quilis, Agustín Acal ##submission.copyrightStatement## https://publicaciones.sadio.org.ar/index.php/JAIIO/article/view/781 Thu, 12 Oct 2023 15:12:55 +0000