Aplicación del algoritmo Boosting Adaptativo (ADABOOST) a un problema de clasificación automática de textos
Boosting es un método que pretende mejorar el desempeño de cualquier algoritmo de aprendizaje supervisado mediante la combinación de los resultados de varios clasificadores débiles o de base para obtener un clasificador final robusto. Una de las técnicas más populares de Boosting es el algoritmo Bo...
Autores principales: | , |
---|---|
Formato: | article artículo publishedVersion |
Lenguaje: | Español |
Publicado: |
Grupo IANUS
2019
|
Materias: | |
Acceso en línea: | http://hdl.handle.net/2133/14282 http://hdl.handle.net/2133/14282 |
Aporte de: |
id |
I15-R121-2133-14282 |
---|---|
record_format |
dspace |
institution |
Universidad Nacional de Rosario |
institution_str |
I-15 |
repository_str |
R-121 |
collection |
Repositorio Hipermedial de la Universidad Nacional de Rosario (UNR) |
language |
Español |
orig_language_str_mv |
spa |
topic |
support vector machine learning |
spellingShingle |
support vector machine learning Barbona, Ivana Beltrán, Celina Aplicación del algoritmo Boosting Adaptativo (ADABOOST) a un problema de clasificación automática de textos |
topic_facet |
support vector machine learning |
description |
Boosting es un método que pretende mejorar el desempeño de cualquier algoritmo de aprendizaje supervisado mediante la combinación de los resultados de varios clasificadores débiles o de base para obtener un clasificador final robusto.
Una de las técnicas más populares de Boosting es el algoritmo Boosting Adaptativo (AdaBoost). Este algoritmo, mediante un entrenamiento iterativo de los clasificadores débiles o de base, le asigna mayor importancia a los datos mal clasificados anteriormente, y de esta manera obtiene un nuevo clasificador. Logra, de esta forma, adaptarse y obtener mejores resultados aumentando la precisión del algoritmo.
En el presente trabajo, con el objetivo de evaluar el desempeño del algoritmo AdaBoost, se aplican los métodos de clasificación Regresión Logística y SMO (Sequential minimal optimization), con y sin el algoritmo AdaBoost a un conjunto de textos. Luego, se comparan los resultados obtenidos de los métodos de clasificación al considerarse solos, con los resultados al considerarlos como algoritmo de base para AdaBoost. El criterio de clasificación utilizado fue el género al que pertenece el texto (Científico / No Científico). La caracterización de los textos está basada en la distribución de frecuencias de las categorías morfo-sintácticas. Los resultados finales de los distintos clasificadores considerados se evalúan mediante porcentajes de mala clasificación. Se observó que al aplicar AdaBoost teniendo en cuenta como algoritmo de base el método de Regresión Logística no se presentó una reducción en el porcentaje de mala clasificación. En cambio, para el caso del método SMO como algoritmo de base, el porcentaje de mala clasificación bajó un 8,67%. |
format |
article artículo publishedVersion |
author |
Barbona, Ivana Beltrán, Celina |
author_facet |
Barbona, Ivana Beltrán, Celina |
author_sort |
Barbona, Ivana |
title |
Aplicación del algoritmo Boosting Adaptativo (ADABOOST) a un problema de clasificación automática de textos |
title_short |
Aplicación del algoritmo Boosting Adaptativo (ADABOOST) a un problema de clasificación automática de textos |
title_full |
Aplicación del algoritmo Boosting Adaptativo (ADABOOST) a un problema de clasificación automática de textos |
title_fullStr |
Aplicación del algoritmo Boosting Adaptativo (ADABOOST) a un problema de clasificación automática de textos |
title_full_unstemmed |
Aplicación del algoritmo Boosting Adaptativo (ADABOOST) a un problema de clasificación automática de textos |
title_sort |
aplicación del algoritmo boosting adaptativo (adaboost) a un problema de clasificación automática de textos |
publisher |
Grupo IANUS |
publishDate |
2019 |
url |
http://hdl.handle.net/2133/14282 http://hdl.handle.net/2133/14282 |
work_keys_str_mv |
AT barbonaivana aplicaciondelalgoritmoboostingadaptativoadaboostaunproblemadeclasificacionautomaticadetextos AT beltrancelina aplicaciondelalgoritmoboostingadaptativoadaboostaunproblemadeclasificacionautomaticadetextos |
bdutipo_str |
Repositorios |
_version_ |
1764820408350015489 |