Métodos y algoritmos para procesamiento distribuido de gratos masivos y evolutivos

El desafío de representar datos en entornos digitales posee gran interés frente a la masiva adopción de Tecnologías de la Información por parte de las poblaciones a escala mundial. Estas representaciones cobran importancia central y las estructuras elegidas condicionan los algoritmos y métodos que s...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Delvechio, Tomás, Giordano, Andrés, Tolosa, Gabriel Hernán
Formato: Objeto de conferencia
Lenguaje:Español
Publicado: 2020
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/104230
Aporte de:
Descripción
Sumario:El desafío de representar datos en entornos digitales posee gran interés frente a la masiva adopción de Tecnologías de la Información por parte de las poblaciones a escala mundial. Estas representaciones cobran importancia central y las estructuras elegidas condicionan los algoritmos y métodos que se usan para su procesamiento. Los grafos (o redes) son una estructura de datos que permite gran expresividad de representación, han sido ampliamente estudiados y existen algoritmos bien conocidos para su procesamiento. Sin embargo, en un entorno de datos masivos aparecen retos que en muchos casos no admiten soluciones triviales. La escalabilidad y optimización de los algoritmos de procesamiento de redes son motivo de incesante trabajo. Decisiones como particionar la estructura en varios subgrafos, generar índices que resuman la información para realizar estimaciones o procesar cambios de la red a través del tiempo afectan de formas diversas los tiempos de cáculo de algunas métricas (ejemplo, de centralidad, distancias, etc.) o la necesidad de almacenamiento. En este plan se propone analizar cómo es posible combinar/rediseñar varias de estas técnicas para obtener ventajas en entornos distribuidos o en el contexto nativo en que se ejecutan estos procesos, estudiar cómo son afectados los recursos según las decisiones de diseño a adoptar y realizar pruebas para conjuntos de datos de composición y tamaños heterogéneos.