Evaluación de un modelo neuronal para la estimación de similaridad entre compuestos a partir de representaciones one-hot

El estudio de la similaridad entre elementos de un conjunto es un problema común en áreas tan diversas como la bioinformática, la informática química y la medicina. En el caso de compuestos químicos, para calcularla, se utilizan descriptores moleculares, como es el caso de las fingerprints, que son...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Borzone, Eugenio, Di Persia, Leandro Ezequiel, Gerard, Matías
Formato: Objeto de conferencia
Lenguaje:Español
Publicado: 2022
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/151714
https://publicaciones.sadio.org.ar/index.php/JAIIO/article/download/276/227
Aporte de:
id I19-R120-10915-151714
record_format dspace
spelling I19-R120-10915-1517142023-05-03T20:02:12Z http://sedici.unlp.edu.ar/handle/10915/151714 https://publicaciones.sadio.org.ar/index.php/JAIIO/article/download/276/227 issn:2451-7496 Evaluación de un modelo neuronal para la estimación de similaridad entre compuestos a partir de representaciones one-hot Borzone, Eugenio Di Persia, Leandro Ezequiel Gerard, Matías 2022-10 2022 2023-04-19T13:17:06Z es Ciencias Informáticas Ciencias Exactas perceptrón multi capa fingerprints similaridad molecular índice de Tanimoto El estudio de la similaridad entre elementos de un conjunto es un problema común en áreas tan diversas como la bioinformática, la informática química y la medicina. En el caso de compuestos químicos, para calcularla, se utilizan descriptores moleculares, como es el caso de las fingerprints, que son representaciones vectoriales de cada compuesto. En este trabajo se estudian diferentes fingerprints ampliamente utilizadas en la literatura, para identificar la más adecuada para el cálculo de similaridad. Además, se busca determinar si es posible predecir ésta similaridad a través de un modelo neuronal. Para esto se caracterizan diferentes fingerprints por su desempeño en términos de predicción de similaridad, distribución de resultados en el intervalo [0,1] y frecuencia de uso en el ámbito científico. Posteriormente, se evalúa la capacidad de un Perceptrón Multicapa (MLP) para predecir la similaridad entre compuestos representados mediante vectores one-hot. Los resultados muestran que las claves MACC proporcionan una buena distribución en los valores de similaridad. El MLP es capaz de inferir con un bajo error (aproximadamente 10% en términos absolutos) la similaridad entre compuestos empleando una representación one-hot. Sociedad Argentina de Informática e Investigación Operativa Objeto de conferencia Objeto de conferencia http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) application/pdf 112-124
institution Universidad Nacional de La Plata
institution_str I-19
repository_str R-120
collection SEDICI (UNLP)
language Español
topic Ciencias Informáticas
Ciencias Exactas
perceptrón multi capa
fingerprints
similaridad molecular
índice de Tanimoto
spellingShingle Ciencias Informáticas
Ciencias Exactas
perceptrón multi capa
fingerprints
similaridad molecular
índice de Tanimoto
Borzone, Eugenio
Di Persia, Leandro Ezequiel
Gerard, Matías
Evaluación de un modelo neuronal para la estimación de similaridad entre compuestos a partir de representaciones one-hot
topic_facet Ciencias Informáticas
Ciencias Exactas
perceptrón multi capa
fingerprints
similaridad molecular
índice de Tanimoto
description El estudio de la similaridad entre elementos de un conjunto es un problema común en áreas tan diversas como la bioinformática, la informática química y la medicina. En el caso de compuestos químicos, para calcularla, se utilizan descriptores moleculares, como es el caso de las fingerprints, que son representaciones vectoriales de cada compuesto. En este trabajo se estudian diferentes fingerprints ampliamente utilizadas en la literatura, para identificar la más adecuada para el cálculo de similaridad. Además, se busca determinar si es posible predecir ésta similaridad a través de un modelo neuronal. Para esto se caracterizan diferentes fingerprints por su desempeño en términos de predicción de similaridad, distribución de resultados en el intervalo [0,1] y frecuencia de uso en el ámbito científico. Posteriormente, se evalúa la capacidad de un Perceptrón Multicapa (MLP) para predecir la similaridad entre compuestos representados mediante vectores one-hot. Los resultados muestran que las claves MACC proporcionan una buena distribución en los valores de similaridad. El MLP es capaz de inferir con un bajo error (aproximadamente 10% en términos absolutos) la similaridad entre compuestos empleando una representación one-hot.
format Objeto de conferencia
Objeto de conferencia
author Borzone, Eugenio
Di Persia, Leandro Ezequiel
Gerard, Matías
author_facet Borzone, Eugenio
Di Persia, Leandro Ezequiel
Gerard, Matías
author_sort Borzone, Eugenio
title Evaluación de un modelo neuronal para la estimación de similaridad entre compuestos a partir de representaciones one-hot
title_short Evaluación de un modelo neuronal para la estimación de similaridad entre compuestos a partir de representaciones one-hot
title_full Evaluación de un modelo neuronal para la estimación de similaridad entre compuestos a partir de representaciones one-hot
title_fullStr Evaluación de un modelo neuronal para la estimación de similaridad entre compuestos a partir de representaciones one-hot
title_full_unstemmed Evaluación de un modelo neuronal para la estimación de similaridad entre compuestos a partir de representaciones one-hot
title_sort evaluación de un modelo neuronal para la estimación de similaridad entre compuestos a partir de representaciones one-hot
publishDate 2022
url http://sedici.unlp.edu.ar/handle/10915/151714
https://publicaciones.sadio.org.ar/index.php/JAIIO/article/download/276/227
work_keys_str_mv AT borzoneeugenio evaluaciondeunmodeloneuronalparalaestimaciondesimilaridadentrecompuestosapartirderepresentacionesonehot
AT dipersialeandroezequiel evaluaciondeunmodeloneuronalparalaestimaciondesimilaridadentrecompuestosapartirderepresentacionesonehot
AT gerardmatias evaluaciondeunmodeloneuronalparalaestimaciondesimilaridadentrecompuestosapartirderepresentacionesonehot
_version_ 1765660001477591040