Selección de centroides para algoritmos de clustering a través de técnicas metaheurísticas

Los algoritmos de clustering de tipo c-means son sensibles a los valores de inicialización de los centroides y pueden quedar atrapados en extremos locales. Planteado en estos términos, el uso de enfoques aproximados para obtener los centroides más adecuados puede ser de gran utilidad como herramient...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Villagra, Andrea, Pandolfi, Daniel
Formato: Objeto de conferencia
Lenguaje:Español
Publicado: 2007
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/23371
Aporte de:
Descripción
Sumario:Los algoritmos de clustering de tipo c-means son sensibles a los valores de inicialización de los centroides y pueden quedar atrapados en extremos locales. Planteado en estos términos, el uso de enfoques aproximados para obtener los centroides más adecuados puede ser de gran utilidad como herramienta complementaria durante ciertas fases del proceso de minería de datos, y en particular dentro de las tareas típicas de minería de datos, entre ellas la de clustering o agrupamiento. En esta dirección, los Algoritmos Genéticos (AGs) y la Optimización Basada en Cúmulo de Partículas (PSO)1 son dos técnicas metaheurísticas poblacionales que podrían utilizarse en este ámbito, más aún cuando los problemas pueden ser planteados como de optimización. En este trabajo se analiza el uso estas dos técnicas metaheurísticas para optimizar la inicialización de los valores de centroides en las funciones aplicadas en los algoritmos de clustering tipo c-means. Los respectivos resultados son comparados usando varios conjuntos de datos generados artificialmente.