Desarrollo e implementación de un algoritmo para determinar la co-evolución de residuos en proteínas y análisis del impacto del uso de alfabetos reducidos
La presente tesis tiene como objetivo desarrollar y evaluar un algoritmo para detectar eficientemente Coevolución de residuos en proteínas basado en los principios de entropía de Shannon e Información Mutua. Se llama Coevolución en proteínas al fenómeno por el cual se pueden observar mutaciones corr...
Guardado en:
| Autor principal: | |
|---|---|
| Otros Autores: | |
| Formato: | Tesis de grado publishedVersion |
| Lenguaje: | Español |
| Publicado: |
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
2015
|
| Materias: | |
| Acceso en línea: | https://hdl.handle.net/20.500.12110/seminario_nCOM000688_Zaiat |
| Aporte de: |
| id |
seminario:seminario_nCOM000688_Zaiat |
|---|---|
| record_format |
dspace |
| spelling |
seminario:seminario_nCOM000688_Zaiat2025-09-29T12:13:32Z Desarrollo e implementación de un algoritmo para determinar la co-evolución de residuos en proteínas y análisis del impacto del uso de alfabetos reducidos Development and implementation of an algorithm to determine the coevolution of residues in proteins and the analysis on the impact of using reduced alphabets Zaiat, Jonathan Javier Martí, Marcelo Adrián Turjanski, Adrián Gustavo COEVOLUCION PROTEINAS INFORMACION MUTUA ENTROPIA ALFABETOS REDUCIDOS IDENTIDAD DE SECUENCIA DISTANCIA DE CONTACTO COEVOLUTION PROTEINS MUTUAL INFORMATION ENTROPY REDUCED ALPHABETS SEQUENCE IDENTITY CONTACT DISTANCE La presente tesis tiene como objetivo desarrollar y evaluar un algoritmo para detectar eficientemente Coevolución de residuos en proteínas basado en los principios de entropía de Shannon e Información Mutua. Se llama Coevolución en proteínas al fenómeno por el cual se pueden observar mutaciones correlacionadas entre pares de aminoácidos al analizar un alineamiento múltiple de secuencias de una proteína. Encontrar estos pares sirve para identificar residuos que interactúan en una proteína, residuos estructural o funcionalmente importantes y posibles sitios de interacción entre la proteína y su sustrato o con otra proteína. En este trabajo se analiza la capacidad predictiva del método desarrollado utilizando alfabetos reducidos, clusters por identidad de secuencia, distintas alternativas para definir la existencia de un contacto entre residuos y el uso de distintas distancias mínimas en secuencia. Los resultados demuestran la eficacia del algoritmo desarrollado para detectar residuos que coevolucionan. Asimismo se concluye que los alfabetos reducidos aportan precisión, que los clusters por identidad de secuencia eliminan redundancias y que uno de los métodos propuestos para calcular contacto entre residuos obtiene mejores resultados que la medida usualmente utilizada. The goal of the present thesis is to develop and evaluate an algorithm for an efficient detection of coevolution in protein residues based on the principles of Shannon’s entropy and Mutual Information. Coevolution in proteins is the phenomenon for which correlated mutations between pairs of amino acids can be seen when analyzing a multiple sequence alignment for a given protein family. Finding these pairs could be useful to identify residues interacting inside a protein, residues structurally or functionally important and potential interaction sites between a protein and a substrate or with another protein. In this work we analyze our method predictive capacity using reduced alphabets, clusters by sequence identity, different alternatives to define the existence of contact between residues and the use of several minimal distances between residues in the sequence. The results prove the accuracy of the algorithm developed to detect coevolving residues. Also, we conclude that reduced alphabets increase the precision, that the clusters by sequence identity eliminate redundancies and that one of the proposed methods to calculate contact between residues obtains better results than the measure most commonly used. Fil: Zaiat, Jonathan Javier. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales 2015 info:eu-repo/semantics/bachelorThesis info:ar-repo/semantics/tesis de grado info:eu-repo/semantics/publishedVersion application/pdf spa info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar https://hdl.handle.net/20.500.12110/seminario_nCOM000688_Zaiat |
| institution |
Universidad de Buenos Aires |
| institution_str |
I-28 |
| repository_str |
R-134 |
| collection |
Biblioteca Digital - Facultad de Ciencias Exactas y Naturales (UBA) |
| language |
Español |
| orig_language_str_mv |
spa |
| topic |
COEVOLUCION PROTEINAS INFORMACION MUTUA ENTROPIA ALFABETOS REDUCIDOS IDENTIDAD DE SECUENCIA DISTANCIA DE CONTACTO COEVOLUTION PROTEINS MUTUAL INFORMATION ENTROPY REDUCED ALPHABETS SEQUENCE IDENTITY CONTACT DISTANCE |
| spellingShingle |
COEVOLUCION PROTEINAS INFORMACION MUTUA ENTROPIA ALFABETOS REDUCIDOS IDENTIDAD DE SECUENCIA DISTANCIA DE CONTACTO COEVOLUTION PROTEINS MUTUAL INFORMATION ENTROPY REDUCED ALPHABETS SEQUENCE IDENTITY CONTACT DISTANCE Zaiat, Jonathan Javier Desarrollo e implementación de un algoritmo para determinar la co-evolución de residuos en proteínas y análisis del impacto del uso de alfabetos reducidos |
| topic_facet |
COEVOLUCION PROTEINAS INFORMACION MUTUA ENTROPIA ALFABETOS REDUCIDOS IDENTIDAD DE SECUENCIA DISTANCIA DE CONTACTO COEVOLUTION PROTEINS MUTUAL INFORMATION ENTROPY REDUCED ALPHABETS SEQUENCE IDENTITY CONTACT DISTANCE |
| description |
La presente tesis tiene como objetivo desarrollar y evaluar un algoritmo para detectar eficientemente Coevolución de residuos en proteínas basado en los principios de entropía de Shannon e Información Mutua. Se llama Coevolución en proteínas al fenómeno por el cual se pueden observar mutaciones correlacionadas entre pares de aminoácidos al analizar un alineamiento múltiple de secuencias de una proteína. Encontrar estos pares sirve para identificar residuos que interactúan en una proteína, residuos estructural o funcionalmente importantes y posibles sitios de interacción entre la proteína y su sustrato o con otra proteína. En este trabajo se analiza la capacidad predictiva del método desarrollado utilizando alfabetos reducidos, clusters por identidad de secuencia, distintas alternativas para definir la existencia de un contacto entre residuos y el uso de distintas distancias mínimas en secuencia. Los resultados demuestran la eficacia del algoritmo desarrollado para detectar residuos que coevolucionan. Asimismo se concluye que los alfabetos reducidos aportan precisión, que los clusters por identidad de secuencia eliminan redundancias y que uno de los métodos propuestos para calcular contacto entre residuos obtiene mejores resultados que la medida usualmente utilizada. |
| author2 |
Martí, Marcelo Adrián |
| author_facet |
Martí, Marcelo Adrián Zaiat, Jonathan Javier |
| format |
Tesis de grado Tesis de grado publishedVersion |
| author |
Zaiat, Jonathan Javier |
| author_sort |
Zaiat, Jonathan Javier |
| title |
Desarrollo e implementación de un algoritmo para determinar la co-evolución de residuos en proteínas y análisis del impacto del uso de alfabetos reducidos |
| title_short |
Desarrollo e implementación de un algoritmo para determinar la co-evolución de residuos en proteínas y análisis del impacto del uso de alfabetos reducidos |
| title_full |
Desarrollo e implementación de un algoritmo para determinar la co-evolución de residuos en proteínas y análisis del impacto del uso de alfabetos reducidos |
| title_fullStr |
Desarrollo e implementación de un algoritmo para determinar la co-evolución de residuos en proteínas y análisis del impacto del uso de alfabetos reducidos |
| title_full_unstemmed |
Desarrollo e implementación de un algoritmo para determinar la co-evolución de residuos en proteínas y análisis del impacto del uso de alfabetos reducidos |
| title_sort |
desarrollo e implementación de un algoritmo para determinar la co-evolución de residuos en proteínas y análisis del impacto del uso de alfabetos reducidos |
| publisher |
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales |
| publishDate |
2015 |
| url |
https://hdl.handle.net/20.500.12110/seminario_nCOM000688_Zaiat |
| work_keys_str_mv |
AT zaiatjonathanjavier desarrolloeimplementaciondeunalgoritmoparadeterminarlacoevolucionderesiduosenproteinasyanalisisdelimpactodelusodealfabetosreducidos AT zaiatjonathanjavier developmentandimplementationofanalgorithmtodeterminethecoevolutionofresiduesinproteinsandtheanalysisontheimpactofusingreducedalphabets |
| _version_ |
1851370969065586688 |