Memorias de las JAIIO

Nota Editorial

María Elena Bueni, Daniel Acevedo — Sat, 05 Oct 2024 00:00:00 +0000

Nota editorial

GBManalizerApp: Una aplicación para la segmentación tridimensional automática del glioblastoma multiforme

Mon, 07 Oct 2024 00:00:00 +0000

El glioblastoma multiforme (GBM) es el tumor cerebral primario más agresivo y de peor pronóstico en adultos. Aunque raramente metastatiza, su alta capacidad invasiva es considerada una de las causas de su casi inevitable recurrencia, lo que reduce su sobrevida media a aproximadamente 15 meses. En este trabajo se propone desarrollar una aplicación (GBManalizerApp) capaz de segmentar de manera tridimensional y automática el GBM, discriminando la masa tumoral activa de su necrosis interna y del usualmente extenso y difuso edema periférico. La aplicación es Matlab-dependiente. El método de preprocesamiento de imágenes utiliza el software SPM12. El algoritmo de segmentación implementado combina técnicas clásicas de procesamiento de imágenes con una red neuronal del tipo perceptrón multicapa alimentada por características radiómicas seleccionadas a partir de imágenes de resonancia magnética (RMN) en sus cuatro modalidades básicas. La herramienta CAD (Computer Assisted Diagnosis) desarrollada permite: 1) Cargar las imágenes de RMN en sus principales modalidades (T1, T1c, T2 y FLAIR) y formatos (DICOM o NifTI). 2) Anonimizar las imágenes. 3) Modificar su visualización ajustando el tamaño y/o contraste. 4) Pre-procesar las imágenes (corregistrar a una misma plantilla anatómica, interpolar a una misma resolución y extraer el cráneo). 5) Segmentar las imágenes. La comparación entre nuestro método de pre-procesamiento y el de los desafíos anuales de segmentación de tumores cerebrales (BraTS) arroja una correlación máxima media del 81%. El método de segmentación, por su lado, ha demostrado una exactitud del 83.9% y coeficientes de similitud Dice del 89.3, 80.7, 79.7 y 66.4% para la región de interés (ROI), tumor activo, edema y necrosis, respectivamente.La GBManalizerApp aquí propuesta y disponible online sienta las bases para el desarrollo local de una nueva herramienta CAD de utilidad clínica en el diagnóstico y tratamiento del glioblastoma multiforme.

Detección automática de anomalías térmicas: Caso Volcán Copahue

Federico Carballo, Andrea Rey, Juan M. Santos, Juliana Gambini — Sat, 12 Oct 2024 00:00:00 +0000

La detección automática y el análisis de anomalías térmicas relacionadas a volcanes es de suma importancia debido a que las mismas son potencialmente indicativas del inicio de procesos eruptivos. Este trabajo está dedicado a la detección automática de anomalías térmicas en el volcán Copahue basada en la interpretación de imágenes satelitales ópticas del sensor ASTER tomadas en los últimos 20 años. El volcán Copahue se encuentra en la frontera entre Argentina y Chile. El mismo registra 12 erupciones en los últimos 250 años, destacándose las ocurridas en 1992, 2000 y 2012. A lo largo del período histórico se han presentado manifestaciones termales superficiales relacionadas con la actividad en profundidad del mismo. El análisis de las anomalías térmicas es una herramienta fundamental para el estudio y monitoreo del volcán. En este trabajo, construimos una base de imágenes satelitales ópticas, utilizando las bandas NIR y TIR, etiquetadas por un experto, que permite entrenar un modelo basado en má- quinas de soporte vectorial (SVM) para detección de anomalías térmicas. Los resultados preliminares son altamente prometedores.

Autoencoders para la extracción de descriptores en imágenes hiperespectrales de la piel

Sat, 12 Oct 2024 00:00:00 +0000

En este estudio, presentamos un enfoque innovador para la extracción de indicadores clave a partir de imágenes hiperespectrales de la piel facial, utilizando técnicas de aprendizaje profundo. La detección temprana y el diagnóstico preciso de enfermedades cutáneas son de suma importancia en la salud pública, especialmente considerando su asociación con afecciones graves como el melanoma. Nuestro método codifica las imágenes mediante autoencoders, los cuales son procesados a través de un análisis de componentes principales (PCA) para identificar patrones significativos para la piel. Estos indicadores no solo capturan características visuales, como tono y textura, sino que también muestran correlaciones con mediciones clínicas cruciales, incluida la presión arterial y los niveles de colesterol, lo cual proporcionar indicadores útiles en la evaluación de la salud cutánea.

Extracción, Visualización y Cuantificación de Cambios en Médanos Costeros: Análisis temporal realizado con imágenes Sentinel-2 de Monte Hermoso, Provincia de Buenos Aires

Alejandro Zambrano Zabaleta, Marina P. Cipolletti, Gerardo M. E. Perillo — Sat, 12 Oct 2024 00:00:00 +0000

Este trabajo plantea un método sistemático para la detección, extracción y medición de un médano de arena a lo largo de un período de 6 años. Se utilizaron imágenes satelitales con una resolución de 10 m extraídas de la misión Sentinel-2, por medio de la base de datos de Google Earth Engine, de las cuales se emplean las bandas normalizadas RGB y el infrarrojo cercano (NIR) de cada punto. Cada imagen es segmentada por medio de un algoritmo de aprendizaje automático no supervisado que agrupa la información en cinco categorías, identificando así las áreas correspondientes a los médanos y generando una máscara georreferenciada. A partir de estas máscaras, se aplican técnicas de extracción de bordes de superresolución para delinear y discriminar polígonos correspondientes a los médanos que permitan calcular áreas y perímetros. Finalmente, se realiza una comparación de la información extraída para cada año en particular. Este enfoque proporciona una caracterización morfológica y una cuantificación temporal del avance o retroceso de los médanos, lo cual resulta fundamental para abordar y tomar decisiones frente a la importancia que representan para sus zonas de influencia.

Refinado Pancromático: Una Estrategia para Incrementar la Resolución en Imágenes Satelitales Hiperespectrales

Steven Martinez Vargas, Alejandro Vitale — Sat, 12 Oct 2024 00:00:00 +0000

La mayor limitación de las imágenes satelitales hiperespectrales (HS) radica en su baja resolución espacial (250 m por píxel en la constelación MODIS, o 30 m en PRISMA). Es común que algunas constelaciones incluyan un sensor pancromático, de mayor resolución, lo que permite mejorar la resolución espacial de las bandas espectrales a través de pansharpening. En este trabajo se analizaron los datos HS PRISMA, que incluyen una imagen pancromática de 5 m por pixel. Se implementaron dos métodos de pansharpening basados en Análisis de Componentes Principales (PCA) y en la Transformada de Brovey, respectivamente. Se evaluaron los resultados utilizando diversas métricas, como el índice de correlación espacial, el índice de correlación espectral, el error cuadrá- tico medio y el índice de relación señal a ruido. Además, se realizó una comparación contra las imágenes HS originales y las imágenes HS con resolución aumentada mediante interpolación spline de tercer orden. Los resultados obtenidos indican que el método basado en PCA ofrece resultados consistentes, con una menor distorsión espectral y una mejor capacidad para extraer detalles de la imagen pancromática, aunque con una respuesta menos satisfactoria en las frecuencias bajas de la imagen.

Detección de Carriles en Vías no Señalizadas mediante LIDAR y Deep Learning para Mejorar la Seguridad Vial

Sat, 12 Oct 2024 00:00:00 +0000

Las causas principales de los accidentes de tráfico se pueden atribuir principalmente a errores humanos como la falta de atención, mal comportamiento o distracción. Para abordar este problema, muchas empresas han desarrollado técnicas para mejorar la seguridad en la conducción y reducir los siniestros viales. Este trabajo presenta un procedimiento para detectar carriles en vías no señalizadas utilizando un sensor LIDAR montado en la parte superior de un vehículo. El escáner láser captura imágenes del entorno del conductor, que luego se procesan para identificar tres regiones dentro de la distancia de frenado del vehículo: izquierda, central y derecha de la calle. Los datos recopilados se utilizan para crear conjuntos de entrenamiento y test, que se analizan mediante bibliotecas de Deep Learning para extraer patrones y construir un modelo de detección de carriles. La efectividad de este modelo se evalúa utilizando la curva ROC. Esta propuesta ofrece una solución integral para estimar la ubicación del carril del vehículo, integrando tecnología LIDAR y técnicas de Deep Learning.

Machine Learning como herramienta para monitoreo e identificación rápida de cianobacterias

Sat, 12 Oct 2024 00:00:00 +0000

Las floraciones de cianobacterias son crecimientos masivos de estos microorganismos acuáticos, que tienen alta relevancia ecológica, sanitaria y económica. Las instituciones públicas y privadas responsables de la gestión de cuerpos de agua no siempre cuentan con personal especializado, por lo que disponer de herramientas automáticas, precisas y sencillas que sirvan de soporte para su detección y caracterización es de suma importancia. Proponemos una solución basada en Machine Learning para el reconocimiento de cianobacterias formadoras de floraciones mediante dos fases: detección y clasificación. Para medir la calidad de nuestra propuesta, se utilizó un dataset propio de imágenes de cianobacterias de diversos cuerpos de agua de Argentina, siendo los géneros seleccionados los principales responsables de floraciones en Argentina en base a relevamientos previos. A través de una red SOM para la detección de cianobacterias y una red CNN pre-entrenada para la clasificación de géneros, se alcanzaron resultados muy prometedores, considerando la poca disponibilidad de muestras, la complejidad de los microorganismos y su poco tratamiento en la literatura.

VesselVAE: Recursive Variational Autoencoders for 3D Blood Vessel Synthesis

Sat, 12 Oct 2024 00:00:00 +0000

We present a data-driven generative framework for synthesizing blood vessel 3D geometry. This is a challenging task due to the complexity of vascular systems, which are highly variating in shape, size, and structure. Existing model-based methods provide some degree of control and variation in the structures produced, but fail to capture the diversity of actual anatomical data. We developed VesselVAE, a recursive variational Neural Network that fully exploits the hierarchical organization of the vessel and learns a low-dimensional manifold encoding branch connectivity along with geometry features describing the target surface. After training, the VesselVAE latent space can be sampled to generate new vessel geometries. To the best of our knowledge, this work is the first to utilize this technique for synthesizing blood vessels. We achieve similarities of synthetic and real data for radius (.97), length (.95), and tortuosity (.96). By leveraging the power of deep neural networks, we generate 3D models of blood vessels that are both accurate and diverse, which is crucial for medical and surgical training, hemodynamic simulations, and many other purposes.

Segmentación de Fetos de Rata Wistar: Primeros Pasos hacia la Automatización de Mediciones en un Modelo Experimental de Diabetes Mellitus

Sat, 12 Oct 2024 00:00:00 +0000

El presente estudio presenta resultados preliminares de la segmentación de fetos de rata como el primer paso hacia la automatización de mediciones en un modelo experimental de diabetes mellitus (DM) mediante análisis digital de imágenes. Utilizando un modelo experimental de DM en ratas Wistar con hiperglucemias moderadas complicadas con gestación, se construyó una base de datos que contiene imágenes de fetos descendientes de madres diabéticas y sanas, junto con información metabólico-morfológica asociada. Se desarrolló un protocolo propio y se utilizó el software ImageJ para obtener mediciones fetales a partir de las imágenes de la base de datos. La segmentación de las imágenes fetales se llevó a cabo utilizando el algoritmo de aprendizaje no supervisado K-Means y el modelo de aprendizaje supervisado SAM. La aplicación de estos métodos representa un avance significativo en la capacidad de analizar la forma fetal y constituyen el primer paso hacia la automatización de mediciones en estudios relacionados con la interacción diabetes-gestación. Este trabajo forma parte del proyecto “Herramientas computacionales validadas en un modelo de DM para la optimización de estudios fetales experimentales”, el cual implica la colaboración de cinco instituciones interdisciplinarias de Cuba y Argentina.

Optimizando la identificación y estudio biológico de aves mediante IA: resultados preliminares

Sat, 12 Oct 2024 00:00:00 +0000

La fotografía de fauna silvestre constituye una herramienta fundamental en la obtención de registros de individuos de aves anilladas (banderillas con códigos únicos) para el estudio de especies de amplia distribución geográfica. El desarrollo tecnológico, junto con el incremento de iniciativas de ciencia ciudadana, han contribuido a enriquecer estos registros de manera exponencial. Esta línea de investigación busca optimizar el procesamiento y el análisis de grandes volúmenes de imágenes con sus metadatos asociados, así como facilitar la exploración e interpretación de datos mediante herramientas analíticas espacio-temporales. Se destacan como resultados preliminares el desarrollo de modelos basados en deep learning para la foto-identificación automatizado del Chorlo Doble Collar (Charadrius falklandicus), un ave playera que típicamente reproduce en las zonas costeras de Patagonia. En particular, se exponen dos modelos obtenidos que demuestran la viabilidad de este enfoque para realizar una clasificación dicotómica de imágenes de presencia/ausencia de la especie y la posterior detección de la banderilla, que permite arribar a la identificación del individuo.

Mapas de expresiones para la clasificación de expresiones faciales basadas en features

Alicia Alvarez Mon, María Elena Buemi, Daniel Acevedo — Sat, 12 Oct 2024 00:00:00 +0000

La clasificación de emociones en imágenes o videos de caras es un tema que es abordado con diferentes enfoques. Algunos de ellos se encuentran basados en técnicas de alto costo computacional como los que utilizan aprendizaje profundo. Otros enfoques más clásicos utilizan herramientas basadas en features o características extraídas de la cara, como aquellas que incluyen información de forma, textura o estructura. En este trabajo proponemos la clasificación de expresiones mediante la construcción de un mapa de expresiones basado en mapas auto-organizados. Dicho mapa se entrena a partir de vectores de dimensión reducida conteniendo información de forma, estructura (a partir de landmarks faciales), y de textura (a partir de componentes de alta y baja frecuencia). Sobre la base CK+ alcanzamos una tasa de reconocimiento superior al 80% a través del mapeo de las instancias de test a los agrupamientos representados en el mapa.

Identificación de Adulteraciones en Quesos Rallados de Pasta Dura utilizando Análisis de Imágenes

Jorge I. Lopez Perez, Lucas G. Visconti — Sat, 12 Oct 2024 00:00:00 +0000

La adulteración de quesos rallados de pasta dura genera inquietudes en torno a la calidad y el valor nutricional de estos productos, planteando potenciales riesgos para la salud pública. Ante este desafío, se requiere un método eficaz que permita identificar aditivos y determinar su concentración, sin comprometer las propiedades organolépticas del producto. El análisis por imágenes se presenta como una alternativa rápida y económica para asegurar la autenticidad y calidad de los productos lácteos, al mismo tiempo que fomenta la transparencia en la industria alimentaria. En este estudio se presenta una implementación innovadora que combina una red neuronal convolucional pre entrenada, VGG16, con un regresor XGBoost para estimar el porcentaje de adulterante presente en quesos rallados. Esta metodología ofrece una evaluación precisa y confiable de la calidad y autenticidad de los productos lácteos. Los resultados obtenidos destacan la eficacia de este enfoque para abordar la adulteración en alimentos y fortalecer la seguridad alimentaria. Mediante el uso de técnicas avanzadas de análisis de datos y aprendizaje automático, este método proporciona una herramienta valiosa para la detección temprana de prácticas fraudulentas en la industria láctea, contribuyendo así a proteger la salud pública y garantizar la calidad de los alimentos para los consumidores.

Avances en Reconstrucción 3D de Cuerpos Humanos mediante Deep Learning

Magda Alexandra Trujillo-Jiménez, José Pablo Navarro, Rolando González-José — Sat, 12 Oct 2024 00:00:00 +0000

En campos como la salud, la antropología, el deporte, el diseño de indumentaria y otros ámbitos relacionados, la obtención de medidas antropométricas precisas es esencial para diversas aplicaciones prácticas, abarcando desde la forma y el tamaño del cuerpo humano hasta la medición de perímetros y volúmenes. El avance de métodos basados en redes neuronales profundas y técnicas de Machine Learning ha revolucionado la capacidad para crear modelos tridimensionales precisos, especialmente en el análisis de mallas 3D, con un enfoque particular en cuerpos humanos. Se presentará una revisión exhaustiva de los avances más recientes en este campo, destacando los modelos y técnicas utilizados para la generación y análisis de mallas 3D aplicados a la reconstrucción antropométrica utilizando modelos basados en Deep Learning. Se abordarán métodos innovadores de segmentación y clasificación, así como técnicas para la estimación precisa de la pose y forma humana, enfatizando los modelos basados en Deep Learning que han simplificado estas tareas. Además, se compartirán resultados preliminares sobre la reconstrucción 3D de cuerpos humanos a partir de video, junto con una discusión sobre los desafíos continuos en términos de precisión y calidad de las reconstrucciones, así como la importancia de optimizar los recursos computacionales para avanzar en este campo prometedor.

CADbot: Grandes modelos de lenguaje para la generación 3D en sintaxis CAD

Santiago Corley, Emmanuel Iarussi — Sat, 12 Oct 2024 00:00:00 +0000

La síntesis de objetos 3D a partir de lenguaje natural es un campo con grandes avances en la literatura reciente. La proliferación de los grandes modelos de lenguaje (LLMs) permitió su uso para esta tarea. En este trabajo presentamos un trabajo en desarrollo con el que proponemos generar objetos CAD en sintaxis OpenSCAD, un lenguaje que permite generar mallas 3D mediante descripciones textuales.

VisDecode: Extracción de decisiones de diseño en visualizaciones con modelos pixel-to-text

Martín A. Sinnona, Viviana Siless, Emmanuel Iarussi — Sat, 12 Oct 2024 00:00:00 +0000

En este trabajo introducimos VisDecode, un framework para extraer decisiones de diseño a partir de visualizaciones. Haciendo uso de imágenes rasterizadas de visualizaciones genéricas (gráficos de barra, lineas, dispersión), nuestro algoritmo identifica atributos perceptuales y los relaciona con los datos. Entrenamos una red neuronal profunda con un dataset sintético que consiste en pares de visualizaciones-decisiones de diseño. Estas visualizaciones fueron rasterizadas a partir de tablas de datos , generadas aleatoriamente por modelos de lenguaje , que incluyen variables cuantitativas y categóricas que se asemejan a datos del mundo real. Luego del entrenamiento, VisDecode es capaz de extraer decisiones de diseño de gráficos provenientes de internet. Nuestro objetivo a mediano plazo es poder mejorar las interfaces de visualización para lograr mejores prácticas de diseño.

DUDF: Differentiable Unsigned Distance Fields with Hyperbolic Scaling

Miguel Fainstein, Viviana Siless, Emmanuel Iarussi — Sat, 12 Oct 2024 00:00:00 +0000

In recent years, there has been a growing interest in training Neural Networks to approximate Unsigned Distance Fields (UDFs) for representing open surfaces in the context of 3D reconstruction. However, UDFs are non-differentiable at the zero level set which leads to significant errors in distances and gradients, generally resulting in fragmented and discontinuous surfaces. In this paper, we propose to learn a hyperbolic scaling of the unsigned distance field, which defines a new Eikonal problem with distinct boundary conditions. This allows our formulation to integrate seamlessly with state-of-the-art continuously differentiable implicit neural representation networks, largely applied in the literature to represent signed distance fields. Our approach not only addresses the challenge of open surface representation but also demonstrates significant improvement in reconstruction quality and training performance. Moreover, the unlocked field’s differentiability allows the accurate computation of essential topological properties such as normal directions and curvatures, pervasive in downstream tasks such as rendering. Through extensive experiments, we validate our approach across various data sets and against competitive baselines. The results demonstrate enhanced accuracy and up to an order of magnitude increase in speed compared to previous methods.