Identificación de propiedades biológicas en organismos utilizando técnicas de machine learning sobre secuencias de genoma completo

El avance de la tecnología y los procesos de secuenciación de genomas de las últimas décadas ha logrado poner al alcance de investigadores de todo el mundo grandes volúmenes de datos biológicos, que debido a su gran escala, los mismos resultan difíciles de analizar en su totalidad, por lo cual es in...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Ferella, Nicolás, Pizio, Pablo Román, Pons, Claudia Fabiana
Formato: Objeto de conferencia
Lenguaje:Español
Publicado: 2023
Materias:
ADN
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/166466
Aporte de:
id I19-R120-10915-166466
record_format dspace
spelling I19-R120-10915-1664662024-05-28T20:07:05Z http://sedici.unlp.edu.ar/handle/10915/166466 Identificación de propiedades biológicas en organismos utilizando técnicas de machine learning sobre secuencias de genoma completo Identification of biological properties in organisms using machine learning techniques on whole genome sequences Ferella, Nicolás Pizio, Pablo Román Pons, Claudia Fabiana 2023-09 2023 2024-05-28T13:43:46Z es Ciencias Informáticas Inteligencia Artificial Genética Big Data ADN El avance de la tecnología y los procesos de secuenciación de genomas de las últimas décadas ha logrado poner al alcance de investigadores de todo el mundo grandes volúmenes de datos biológicos, que debido a su gran escala, los mismos resultan difíciles de analizar en su totalidad, por lo cual es intuitivo pensar en Inteligencia Artificial para trabajar con dicha información. Con el objetivo de disminuir la brecha existente entre el investigador y las herramientas de Inteligencia Artificial, se desarrolló un software que permite crear un espacio de trabajo para un organismo biológico, realizar el procesamiento de los genomas correspondientes y permitir la creación y entrenamiento de modelos de Machine Learning desde una interfaz gráfica. Los modelos entrenados luego se analizan para buscar qué patrones determinan el resultado de la propiedad biológica a investigar sobre el organismo biológico en cuestión, y así encontrar los genes de mayor impacto en las predicciones del modelo, permitiendo al investigador el posterior análisis en laboratorio de un gen deseado. The advance in technology and genome sequencing processes in the recent decades have made large volumes of biological data available to researchers from all over the world, which, due to the large scales, are difficult to analyze in their entirety. Therefore, it is intuitive to think of Artificial Intelligence to work with such information. In order to reduce the existing gap between the researchers and the Artificial Intelligence tools, a software was developed that allows the creation of a workspace for biological organisms, the processing of its corresponding genomes, and the creation and training of models of Machine Learning, everything using a simple (yet powerful) graphical interface. The trained models are then analyzed to find which patterns determine the result of the property that is being investigated on the biological organism, finding in the process the genes with the greatest impact on the model’s predictions, allowing the researcher to subsequently analyze the desired genes in the laboratory, saving time and resources in the process. Sociedad Argentina de Informática e Investigación Operativa Objeto de conferencia Objeto de conferencia http://creativecommons.org/licenses/by-nc-sa/4.0/ Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) application/pdf 218-234
institution Universidad Nacional de La Plata
institution_str I-19
repository_str R-120
collection SEDICI (UNLP)
language Español
topic Ciencias Informáticas
Inteligencia Artificial
Genética
Big Data
ADN
spellingShingle Ciencias Informáticas
Inteligencia Artificial
Genética
Big Data
ADN
Ferella, Nicolás
Pizio, Pablo Román
Pons, Claudia Fabiana
Identificación de propiedades biológicas en organismos utilizando técnicas de machine learning sobre secuencias de genoma completo
topic_facet Ciencias Informáticas
Inteligencia Artificial
Genética
Big Data
ADN
description El avance de la tecnología y los procesos de secuenciación de genomas de las últimas décadas ha logrado poner al alcance de investigadores de todo el mundo grandes volúmenes de datos biológicos, que debido a su gran escala, los mismos resultan difíciles de analizar en su totalidad, por lo cual es intuitivo pensar en Inteligencia Artificial para trabajar con dicha información. Con el objetivo de disminuir la brecha existente entre el investigador y las herramientas de Inteligencia Artificial, se desarrolló un software que permite crear un espacio de trabajo para un organismo biológico, realizar el procesamiento de los genomas correspondientes y permitir la creación y entrenamiento de modelos de Machine Learning desde una interfaz gráfica. Los modelos entrenados luego se analizan para buscar qué patrones determinan el resultado de la propiedad biológica a investigar sobre el organismo biológico en cuestión, y así encontrar los genes de mayor impacto en las predicciones del modelo, permitiendo al investigador el posterior análisis en laboratorio de un gen deseado.
format Objeto de conferencia
Objeto de conferencia
author Ferella, Nicolás
Pizio, Pablo Román
Pons, Claudia Fabiana
author_facet Ferella, Nicolás
Pizio, Pablo Román
Pons, Claudia Fabiana
author_sort Ferella, Nicolás
title Identificación de propiedades biológicas en organismos utilizando técnicas de machine learning sobre secuencias de genoma completo
title_short Identificación de propiedades biológicas en organismos utilizando técnicas de machine learning sobre secuencias de genoma completo
title_full Identificación de propiedades biológicas en organismos utilizando técnicas de machine learning sobre secuencias de genoma completo
title_fullStr Identificación de propiedades biológicas en organismos utilizando técnicas de machine learning sobre secuencias de genoma completo
title_full_unstemmed Identificación de propiedades biológicas en organismos utilizando técnicas de machine learning sobre secuencias de genoma completo
title_sort identificación de propiedades biológicas en organismos utilizando técnicas de machine learning sobre secuencias de genoma completo
publishDate 2023
url http://sedici.unlp.edu.ar/handle/10915/166466
work_keys_str_mv AT ferellanicolas identificaciondepropiedadesbiologicasenorganismosutilizandotecnicasdemachinelearningsobresecuenciasdegenomacompleto
AT piziopabloroman identificaciondepropiedadesbiologicasenorganismosutilizandotecnicasdemachinelearningsobresecuenciasdegenomacompleto
AT ponsclaudiafabiana identificaciondepropiedadesbiologicasenorganismosutilizandotecnicasdemachinelearningsobresecuenciasdegenomacompleto
AT ferellanicolas identificationofbiologicalpropertiesinorganismsusingmachinelearningtechniquesonwholegenomesequences
AT piziopabloroman identificationofbiologicalpropertiesinorganismsusingmachinelearningtechniquesonwholegenomesequences
AT ponsclaudiafabiana identificationofbiologicalpropertiesinorganismsusingmachinelearningtechniquesonwholegenomesequences
_version_ 1807223110081970176