Algoritmos rápidos para computar estimadores robustos

Mostrar todas las versiones(3)

El método más comunmente usado para estimar los coeficientes de una regresión lineal es el de mínimos cuadrados. Este método que es óptimo en el caso de errores distribuídos normalmente, es muy sensible a la presencia de outliers. Para remediar ese problema se han desarrollado otros métodos de estim...

Descripción completa

Detalles Bibliográficos
Autor principal:	Ambrosio, Beatriz
Formato:	Tesis de Maestría
Lenguaje:	Español
Publicado:	2004
Acceso en línea:	https://hdl.handle.net/20.500.12110/tesis_n3765_Ambrosio
Aporte de:	Biblioteca Digital - Facultad de Ciencias Exactas y Naturales (UBA) de Universidad de Buenos Aires

id	todo:tesis_n3765_Ambrosio
record_format	dspace
spelling	todo:tesis_n3765_Ambrosio2023-10-03T12:43:29Z Algoritmos rápidos para computar estimadores robustos Ambrosio, Beatriz El método más comunmente usado para estimar los coeficientes de una regresión lineal es el de mínimos cuadrados. Este método que es óptimo en el caso de errores distribuídos normalmente, es muy sensible a la presencia de outliers. Para remediar ese problema se han desarrollado otros métodos de estimación llamados métodos robustos, los cuales se ven poco afectados por la presencia de datos atípicos. Una medida de la robustez de un estimador es su punto de ruptura. Entre los estimadores de regresión robustos se encuentran los LTS, LMS y los S estimadores. Estos estimadores son equivariantes por transformaciones afines, de regresión, y de escala y además tiene un alto punto de ruptura. El inconveniente que presenta su calculo es que requiere muchas horas de computadora. Rouseeuw y Van Driessen desarrollaron un algoritmo, llamado Fast -LTS, que mejora la velocidad de cálculo del estimador de mínimos cuadrados podados. El objetivo de este trabajo es desarrollar un nuevo algoritmo, análogo al Fast-LTS, para computar S estimadores. Del mismo modo que el algoritmo desarrollado por Rouseeuw, este nuevo algoritmo está basado en el mejoramiento local de los nuevos estimadores iniciales. Esto permite una significativa reducción del número de candidatos requeridos para obtener una buena aproximación de la solución óptima. Se ha realizado un estudio de simulación que ha mostrado que los S estimadores calculados con el algoritmo Fast-S, son comparativamente mejores a los estimadores LTS calculados con el algoritmo Fast-LTS. Algunas de las ventajas del nuevo algoritmo son: 1) Menor porcentaje de muestras afectadas por los datos atípicos. 2) Menor error cuadrático medio. 3) Menor tiempo de cómputo. Regression analysis is an important statistical tool that is applied in most sciences. The purpose of regression analysis is to fit equations to observed variables. The most commonly regression technique is the least squares method, generally adopted because of tradition and easier computation. However these method is very sensitive to the presence of atypical points in the sample. An observation is an atypical point or outlier if it does not follow the model. To remedy this problem the robust mothods have been developed that are not so easuly affected by outliers. One mesure of robustness of an estimate is its breakdown point. Heuristically, the breakdown point is the minimun fraction of arbitrary outliers that can take the estimate beyond any limit. The breakdown point as an asymptotic concept has been introduced by Hampel (1971). Donoho and Huber (1983) gave the corresponding finite sample notion. A desirable property for regression estimates is that the estimate be equivariant with respect to affine, regression and scale transformations. Estimates are computationally expensive, and the corresponding algorithms become unfasible for moderately large number of regressors. In this thesis we propose an algorithm for computing S-estimates, analogous to the algorithm of Rousseeuw and Van Driessen (Fast-LTS) to improve the computational speed of the LTS-estimate. The new algorithm, that we call "fast-S", is based on a "local improvement" step of the re-sampling initial candidates. This allows a substantial reduction of the number of candidates requiered to obtain a good approximation to the optimal solution. We performed a simulation study wich shows that S-estimators computed with the fast-S algorithm compare favourably to the LTS estimator computed with the fast-LTS algorithm. Fil: Ambrosio, Beatriz. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. 2004-11 Tesis de Maestría PDF Español info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar https://hdl.handle.net/20.500.12110/tesis_n3765_Ambrosio
institution	Universidad de Buenos Aires
institution_str	I-28
repository_str	R-134
collection	Biblioteca Digital - Facultad de Ciencias Exactas y Naturales (UBA)
language	Español
orig_language_str_mv	Español
description	El método más comunmente usado para estimar los coeficientes de una regresión lineal es el de mínimos cuadrados. Este método que es óptimo en el caso de errores distribuídos normalmente, es muy sensible a la presencia de outliers. Para remediar ese problema se han desarrollado otros métodos de estimación llamados métodos robustos, los cuales se ven poco afectados por la presencia de datos atípicos. Una medida de la robustez de un estimador es su punto de ruptura. Entre los estimadores de regresión robustos se encuentran los LTS, LMS y los S estimadores. Estos estimadores son equivariantes por transformaciones afines, de regresión, y de escala y además tiene un alto punto de ruptura. El inconveniente que presenta su calculo es que requiere muchas horas de computadora. Rouseeuw y Van Driessen desarrollaron un algoritmo, llamado Fast -LTS, que mejora la velocidad de cálculo del estimador de mínimos cuadrados podados. El objetivo de este trabajo es desarrollar un nuevo algoritmo, análogo al Fast-LTS, para computar S estimadores. Del mismo modo que el algoritmo desarrollado por Rouseeuw, este nuevo algoritmo está basado en el mejoramiento local de los nuevos estimadores iniciales. Esto permite una significativa reducción del número de candidatos requeridos para obtener una buena aproximación de la solución óptima. Se ha realizado un estudio de simulación que ha mostrado que los S estimadores calculados con el algoritmo Fast-S, son comparativamente mejores a los estimadores LTS calculados con el algoritmo Fast-LTS. Algunas de las ventajas del nuevo algoritmo son: 1) Menor porcentaje de muestras afectadas por los datos atípicos. 2) Menor error cuadrático medio. 3) Menor tiempo de cómputo.
format	Tesis de Maestría
author	Ambrosio, Beatriz
spellingShingle	Ambrosio, Beatriz Algoritmos rápidos para computar estimadores robustos
author_facet	Ambrosio, Beatriz
author_sort	Ambrosio, Beatriz
title	Algoritmos rápidos para computar estimadores robustos
title_short	Algoritmos rápidos para computar estimadores robustos
title_full	Algoritmos rápidos para computar estimadores robustos
title_fullStr	Algoritmos rápidos para computar estimadores robustos
title_full_unstemmed	Algoritmos rápidos para computar estimadores robustos
title_sort	algoritmos rápidos para computar estimadores robustos
publishDate	2004
url	https://hdl.handle.net/20.500.12110/tesis_n3765_Ambrosio
work_keys_str_mv	AT ambrosiobeatriz algoritmosrapidosparacomputarestimadoresrobustos
_version_	1807322194076762112

Algoritmos rápidos para computar estimadores robustos

Ejemplares similares