Nuevo índice para el análisis de estabilidad en clusters solapados

Analizar la estabilidad de una solución de clustering implica medir la capacidad de un algoritmo para producir resultados similares dada una misma fuente de datos de entrada. Los índices de validación externa permiten cuantificar dicha similitud entre un par de soluciones de clustering. Dentro de lo...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Campo, David N., Stegmayer, Georgina, Milone, Diego H.
Formato: Objeto de conferencia
Lenguaje:Español
Publicado: 2013
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/76139
http://42jaiio.sadio.org.ar/proceedings/simposios/Trabajos/ASAI/03.pdf
Aporte de:
Descripción
Sumario:Analizar la estabilidad de una solución de clustering implica medir la capacidad de un algoritmo para producir resultados similares dada una misma fuente de datos de entrada. Los índices de validación externa permiten cuantificar dicha similitud entre un par de soluciones de clustering. Dentro de los índices clásicos mas utilizados es posible validar soluciones con clusters no solapados, en donde cada patrón sólo puede pertenecer a un cluster. Sin embargo, en aplicaciones prácticas, generalmente se dan situaciones en las que un patrón podría poseer más de una etiqueta. En este trabajo se analiza un índice de validación externa desde un enfoque probabilístico y se provee una reformulación aplicable a soluciones con clusters solapados. Luego de presentar el nuevo índice, se muestran y discuten resultados de experimentos realizados sobre ejemplos artificiales y una base de datos real. Los resultados muestran cómo el nuevo índice puede medir adecuadamente la similitud entre clusters solapados, permitiendo asó analizar la estabilidad en ambos casos.