Desarrollo e implementación de un algoritmo para determinar la co-evolución de residuos en proteínas y análisis del impacto del uso de alfabetos reducidos

La presente tesis tiene como objetivo desarrollar y evaluar un algoritmo para detectar eficientemente Coevolución de residuos en proteínas basado en los principios de entropía de Shannon e Información Mutua. Se llama Coevolución en proteínas al fenómeno por el cual se pueden observar mutaciones corr...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autor principal: Zaiat, Jonathan Javier
Otros Autores: Martí, Marcelo Adrián
Formato: Tesis de grado publishedVersion
Lenguaje:Español
Publicado: Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales 2015
Materias:
Acceso en línea:https://hdl.handle.net/20.500.12110/seminario_nCOM000688_Zaiat
Aporte de:
id seminario:seminario_nCOM000688_Zaiat
record_format dspace
spelling seminario:seminario_nCOM000688_Zaiat2025-09-29T12:13:32Z Desarrollo e implementación de un algoritmo para determinar la co-evolución de residuos en proteínas y análisis del impacto del uso de alfabetos reducidos Development and implementation of an algorithm to determine the coevolution of residues in proteins and the analysis on the impact of using reduced alphabets Zaiat, Jonathan Javier Martí, Marcelo Adrián Turjanski, Adrián Gustavo COEVOLUCION PROTEINAS INFORMACION MUTUA ENTROPIA ALFABETOS REDUCIDOS IDENTIDAD DE SECUENCIA DISTANCIA DE CONTACTO COEVOLUTION PROTEINS MUTUAL INFORMATION ENTROPY REDUCED ALPHABETS SEQUENCE IDENTITY CONTACT DISTANCE La presente tesis tiene como objetivo desarrollar y evaluar un algoritmo para detectar eficientemente Coevolución de residuos en proteínas basado en los principios de entropía de Shannon e Información Mutua. Se llama Coevolución en proteínas al fenómeno por el cual se pueden observar mutaciones correlacionadas entre pares de aminoácidos al analizar un alineamiento múltiple de secuencias de una proteína. Encontrar estos pares sirve para identificar residuos que interactúan en una proteína, residuos estructural o funcionalmente importantes y posibles sitios de interacción entre la proteína y su sustrato o con otra proteína. En este trabajo se analiza la capacidad predictiva del método desarrollado utilizando alfabetos reducidos, clusters por identidad de secuencia, distintas alternativas para definir la existencia de un contacto entre residuos y el uso de distintas distancias mínimas en secuencia. Los resultados demuestran la eficacia del algoritmo desarrollado para detectar residuos que coevolucionan. Asimismo se concluye que los alfabetos reducidos aportan precisión, que los clusters por identidad de secuencia eliminan redundancias y que uno de los métodos propuestos para calcular contacto entre residuos obtiene mejores resultados que la medida usualmente utilizada. The goal of the present thesis is to develop and evaluate an algorithm for an efficient detection of coevolution in protein residues based on the principles of Shannon’s entropy and Mutual Information. Coevolution in proteins is the phenomenon for which correlated mutations between pairs of amino acids can be seen when analyzing a multiple sequence alignment for a given protein family. Finding these pairs could be useful to identify residues interacting inside a protein, residues structurally or functionally important and potential interaction sites between a protein and a substrate or with another protein. In this work we analyze our method predictive capacity using reduced alphabets, clusters by sequence identity, different alternatives to define the existence of contact between residues and the use of several minimal distances between residues in the sequence. The results prove the accuracy of the algorithm developed to detect coevolving residues. Also, we conclude that reduced alphabets increase the precision, that the clusters by sequence identity eliminate redundancies and that one of the proposed methods to calculate contact between residues obtains better results than the measure most commonly used. Fil: Zaiat, Jonathan Javier. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales 2015 info:eu-repo/semantics/bachelorThesis info:ar-repo/semantics/tesis de grado info:eu-repo/semantics/publishedVersion application/pdf spa info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar https://hdl.handle.net/20.500.12110/seminario_nCOM000688_Zaiat
institution Universidad de Buenos Aires
institution_str I-28
repository_str R-134
collection Biblioteca Digital - Facultad de Ciencias Exactas y Naturales (UBA)
language Español
orig_language_str_mv spa
topic COEVOLUCION
PROTEINAS
INFORMACION MUTUA
ENTROPIA
ALFABETOS REDUCIDOS
IDENTIDAD DE SECUENCIA
DISTANCIA DE CONTACTO
COEVOLUTION
PROTEINS
MUTUAL INFORMATION
ENTROPY
REDUCED ALPHABETS
SEQUENCE IDENTITY
CONTACT DISTANCE
spellingShingle COEVOLUCION
PROTEINAS
INFORMACION MUTUA
ENTROPIA
ALFABETOS REDUCIDOS
IDENTIDAD DE SECUENCIA
DISTANCIA DE CONTACTO
COEVOLUTION
PROTEINS
MUTUAL INFORMATION
ENTROPY
REDUCED ALPHABETS
SEQUENCE IDENTITY
CONTACT DISTANCE
Zaiat, Jonathan Javier
Desarrollo e implementación de un algoritmo para determinar la co-evolución de residuos en proteínas y análisis del impacto del uso de alfabetos reducidos
topic_facet COEVOLUCION
PROTEINAS
INFORMACION MUTUA
ENTROPIA
ALFABETOS REDUCIDOS
IDENTIDAD DE SECUENCIA
DISTANCIA DE CONTACTO
COEVOLUTION
PROTEINS
MUTUAL INFORMATION
ENTROPY
REDUCED ALPHABETS
SEQUENCE IDENTITY
CONTACT DISTANCE
description La presente tesis tiene como objetivo desarrollar y evaluar un algoritmo para detectar eficientemente Coevolución de residuos en proteínas basado en los principios de entropía de Shannon e Información Mutua. Se llama Coevolución en proteínas al fenómeno por el cual se pueden observar mutaciones correlacionadas entre pares de aminoácidos al analizar un alineamiento múltiple de secuencias de una proteína. Encontrar estos pares sirve para identificar residuos que interactúan en una proteína, residuos estructural o funcionalmente importantes y posibles sitios de interacción entre la proteína y su sustrato o con otra proteína. En este trabajo se analiza la capacidad predictiva del método desarrollado utilizando alfabetos reducidos, clusters por identidad de secuencia, distintas alternativas para definir la existencia de un contacto entre residuos y el uso de distintas distancias mínimas en secuencia. Los resultados demuestran la eficacia del algoritmo desarrollado para detectar residuos que coevolucionan. Asimismo se concluye que los alfabetos reducidos aportan precisión, que los clusters por identidad de secuencia eliminan redundancias y que uno de los métodos propuestos para calcular contacto entre residuos obtiene mejores resultados que la medida usualmente utilizada.
author2 Martí, Marcelo Adrián
author_facet Martí, Marcelo Adrián
Zaiat, Jonathan Javier
format Tesis de grado
Tesis de grado
publishedVersion
author Zaiat, Jonathan Javier
author_sort Zaiat, Jonathan Javier
title Desarrollo e implementación de un algoritmo para determinar la co-evolución de residuos en proteínas y análisis del impacto del uso de alfabetos reducidos
title_short Desarrollo e implementación de un algoritmo para determinar la co-evolución de residuos en proteínas y análisis del impacto del uso de alfabetos reducidos
title_full Desarrollo e implementación de un algoritmo para determinar la co-evolución de residuos en proteínas y análisis del impacto del uso de alfabetos reducidos
title_fullStr Desarrollo e implementación de un algoritmo para determinar la co-evolución de residuos en proteínas y análisis del impacto del uso de alfabetos reducidos
title_full_unstemmed Desarrollo e implementación de un algoritmo para determinar la co-evolución de residuos en proteínas y análisis del impacto del uso de alfabetos reducidos
title_sort desarrollo e implementación de un algoritmo para determinar la co-evolución de residuos en proteínas y análisis del impacto del uso de alfabetos reducidos
publisher Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
publishDate 2015
url https://hdl.handle.net/20.500.12110/seminario_nCOM000688_Zaiat
work_keys_str_mv AT zaiatjonathanjavier desarrolloeimplementaciondeunalgoritmoparadeterminarlacoevolucionderesiduosenproteinasyanalisisdelimpactodelusodealfabetosreducidos
AT zaiatjonathanjavier developmentandimplementationofanalgorithmtodeterminethecoevolutionofresiduesinproteinsandtheanalysisontheimpactofusingreducedalphabets
_version_ 1851370969065586688