Modelo de decisión para la validación de métodos de imputación mediante la utilización de algoritmos de minería de datos
Muchos de los conjuntos de datos (data sets) existentes u obtenidos en investigaciones científicas contienen valores faltantes (MVs: Missing Values) y anomalías (outliers) asociados a procedimientos de entrada manuales deficientes, mediciones incorrectas o errores en los instrumentos de...
Guardado en:
| Autores principales: | , , |
|---|---|
| Formato: | Documento de conferencia |
| Lenguaje: | Español |
| Publicado: |
Universidad Nacional del Nordeste. Facultad de Ciencias Exactas y Naturales y Agrimensura
2021
|
| Materias: | |
| Acceso en línea: | http://repositorio.unne.edu.ar/handle/123456789/30357 |
| Aporte de: |
| Sumario: | Muchos de los conjuntos de datos (data sets)
existentes u obtenidos en investigaciones
científicas contienen valores faltantes (MVs:
Missing Values) y anomalías (outliers)
asociados a procedimientos de entrada
manuales deficientes, mediciones incorrectas
o errores en los instrumentos de medición. En
minería de datos (DM: Data Mining) estas
imperfecciones pueden afectar negativamente
la calidad del proceso de aprendizaje
supervisado o el rendimiento de algoritmos de
agrupamiento de datos. La imputación es una
técnica para reemplazar MVs con valores
sustituidos. Pocos estudios informan una
evaluación global de los métodos existentes
con el fin de proporcionar directrices para
hacer la elección metodológica más apropiada
en la práctica. El propósito general de este
trabajo es determinar un modelo de decisión
que permita encontrar los métodos de
imputación más adecuados para completar
información faltante en un conjunto de datos
mediante la utilización de algoritmos de DM. |
|---|