Evaluación de un modelo neuronal para la estimación de similaridad entre compuestos a partir de representaciones one-hot

  • Eugenio Borzone Instituto de investigación en señales, sistemas e inteligencia computacional (sınc(i)), FICH–UNL/CONICET
  • Leandro Ezequiel Di Persia Instituto de Investigación en Señales, Sistemas e Inteligencia Computacional, sınc(i), FICH-UNL/CONICET
  • Matias Gerard Instituto de Investigación en Señales, Sistemas e Inteligencia Computacional, sınc(i), FICH-UNL/CONICET
Palabras clave: Perceptrón multi capa, Fingerprints, Similaridad molecular, Indice de Tanimoto

Resumen

El estudio de la similaridad entre elementos de un conjunto es un problema común en áreas tan diversas como la bioinformática, la informática química y la medicina. En el caso de compuestos químicos, para calcularla, se utilizan descriptores moleculares, como es el caso de las fingerprints, que son representaciones vectoriales de cada compuesto. En este trabajo se estudian diferentes fingerprints ampliamente utilizadas en la literatura, para identificar la más adecuada para el cálculo de similaridad. Además, se busca determinar si es posible predecir ésta similaridad a través de un modelo neuronal. Para esto se caracterizan diferentes fingerprints por su desempeño en términos de predicción de similaridad, distribución de resultados en el intervalo [0,1] y frecuencia de uso en el ámbito científico. Posteriormente, se evalúa la capacidad de un Perceptrón Multicapa (MLP) para predecir la similaridad entre compuestos representados mediante vectores one-hot.
Los resultados muestran que las claves MACC proporcionan una buena distribución en los valores de similaridad. El MLP es capaz de inferir con
un bajo error (aproximadamente 10% en términos absolutos) la similaridad
entre compuestos empleando una representación one-hot.

Publicado
2022-12-14
Cómo citar
Borzone, E., Di Persia, L., & Gerard, M. (2022). Evaluación de un modelo neuronal para la estimación de similaridad entre compuestos a partir de representaciones one-hot. Memorias De Las JAIIO, 8(2), 112-124. Recuperado a partir de https://publicaciones.sadio.org.ar/index.php/JAIIO/article/view/276
Sección
ASAI - Simposio Argentino de Inteligencia Artificial