Clasificación automática de estudios epidemiológicos referentes a distintos tipos de cáncer utilizando un meta-estimador bagging con Naïve Bayes

Los estudios epidemiológicos de tipo caso-control referentes a polimorfismos de nucleótidos simples relacionados a distintos tipos de cáncer representan una fuente fundamental de información para los expertos en el área de análisis genético. Estos han aumentado exponencialmente en la última década,...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Mounier, Mónica, Acosta, Karina Beatriz, Favret, Fabián, Zamudio, Eduardo
Formato: Objeto de conferencia
Lenguaje:Español
Publicado: 2018
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/70802
http://47jaiio.sadio.org.ar/sites/default/files/ASAI-16.pdf
Aporte de:
Descripción
Sumario:Los estudios epidemiológicos de tipo caso-control referentes a polimorfismos de nucleótidos simples relacionados a distintos tipos de cáncer representan una fuente fundamental de información para los expertos en el área de análisis genético. Estos han aumentado exponencialmente en la última década, por lo que hay un gran interés de los expertos en la utilización de herramientas bioinformáticas que clasifiquen automáticamente la documentación disponible para descubrir conocimiento aplicable a tareas de análisis específicas. La minería de textos procesa la información no estructurada y extrae índices numéricos desde el texto, posibilitando su procesamiento por algoritmos de aprendizaje automático. Este trabajo propone la implementación de un meta-estimador Bagging con Naïve Bayes, utilizando técnicas de pre-procesamiento de texto (tokenización, lematización, tratamiento de negaciones y eliminación de stop words). Los resultados obtenidos han demostrado que el meta-estimador propuesto junto a la utilización de técnicas adecuadas de pre-procesamiento pueden lograr óptimos resultados de clasificación.