Aplicación del algoritmo Boosting Adaptativo (ADABOOST) a un problema de clasificación automática de textos

Boosting es un método que pretende mejorar el desempeño de cualquier algoritmo de aprendizaje supervisado mediante la combinación de los resultados de varios clasificadores débiles o de base para obtener un clasificador final robusto. Una de las técnicas más populares de Boosting es el algoritmo Bo...

Descripción completa

Detalles Bibliográficos
Autores principales: Barbona, Ivana, Beltrán, Celina
Formato: article artículo publishedVersion
Lenguaje:Español
Publicado: Grupo IANUS 2019
Materias:
Acceso en línea:http://hdl.handle.net/2133/14282
http://hdl.handle.net/2133/14282
Aporte de:
id I15-R121-2133-14282
record_format dspace
institution Universidad Nacional de Rosario
institution_str I-15
repository_str R-121
collection Repositorio Hipermedial de la Universidad Nacional de Rosario (UNR)
language Español
orig_language_str_mv spa
topic support
vector
machine
learning
spellingShingle support
vector
machine
learning
Barbona, Ivana
Beltrán, Celina
Aplicación del algoritmo Boosting Adaptativo (ADABOOST) a un problema de clasificación automática de textos
topic_facet support
vector
machine
learning
description Boosting es un método que pretende mejorar el desempeño de cualquier algoritmo de aprendizaje supervisado mediante la combinación de los resultados de varios clasificadores débiles o de base para obtener un clasificador final robusto. Una de las técnicas más populares de Boosting es el algoritmo Boosting Adaptativo (AdaBoost). Este algoritmo, mediante un entrenamiento iterativo de los clasificadores débiles o de base, le asigna mayor importancia a los datos mal clasificados anteriormente, y de esta manera obtiene un nuevo clasificador. Logra, de esta forma, adaptarse y obtener mejores resultados aumentando la precisión del algoritmo. En el presente trabajo, con el objetivo de evaluar el desempeño del algoritmo AdaBoost, se aplican los métodos de clasificación Regresión Logística y SMO (Sequential minimal optimization), con y sin el algoritmo AdaBoost a un conjunto de textos. Luego, se comparan los resultados obtenidos de los métodos de clasificación al considerarse solos, con los resultados al considerarlos como algoritmo de base para AdaBoost. El criterio de clasificación utilizado fue el género al que pertenece el texto (Científico / No Científico). La caracterización de los textos está basada en la distribución de frecuencias de las categorías morfo-sintácticas. Los resultados finales de los distintos clasificadores considerados se evalúan mediante porcentajes de mala clasificación. Se observó que al aplicar AdaBoost teniendo en cuenta como algoritmo de base el método de Regresión Logística no se presentó una reducción en el porcentaje de mala clasificación. En cambio, para el caso del método SMO como algoritmo de base, el porcentaje de mala clasificación bajó un 8,67%.
format article
artículo
publishedVersion
author Barbona, Ivana
Beltrán, Celina
author_facet Barbona, Ivana
Beltrán, Celina
author_sort Barbona, Ivana
title Aplicación del algoritmo Boosting Adaptativo (ADABOOST) a un problema de clasificación automática de textos
title_short Aplicación del algoritmo Boosting Adaptativo (ADABOOST) a un problema de clasificación automática de textos
title_full Aplicación del algoritmo Boosting Adaptativo (ADABOOST) a un problema de clasificación automática de textos
title_fullStr Aplicación del algoritmo Boosting Adaptativo (ADABOOST) a un problema de clasificación automática de textos
title_full_unstemmed Aplicación del algoritmo Boosting Adaptativo (ADABOOST) a un problema de clasificación automática de textos
title_sort aplicación del algoritmo boosting adaptativo (adaboost) a un problema de clasificación automática de textos
publisher Grupo IANUS
publishDate 2019
url http://hdl.handle.net/2133/14282
http://hdl.handle.net/2133/14282
work_keys_str_mv AT barbonaivana aplicaciondelalgoritmoboostingadaptativoadaboostaunproblemadeclasificacionautomaticadetextos
AT beltrancelina aplicaciondelalgoritmoboostingadaptativoadaboostaunproblemadeclasificacionautomaticadetextos
bdutipo_str Repositorios
_version_ 1764820408350015489