Algoritmos rápidos para computar estimadores robustos

El método más comunmente usado para estimar los coeficientes de una regresión lineal es el de mínimos cuadrados. Este método que es óptimo en el caso de errores distribuídos normalmente, es muy sensible a la presencia de outliers. Para remediar ese problema se han desarrollado otros métodos de estim...

Descripción completa

Detalles Bibliográficos
Autor principal: Ambrosio, Beatriz
Formato: Tesis de Maestría
Lenguaje:Español
Publicado: 2004
Acceso en línea:https://hdl.handle.net/20.500.12110/tesis_n3765_Ambrosio
Aporte de:
id todo:tesis_n3765_Ambrosio
record_format dspace
spelling todo:tesis_n3765_Ambrosio2023-10-03T12:43:29Z Algoritmos rápidos para computar estimadores robustos Ambrosio, Beatriz El método más comunmente usado para estimar los coeficientes de una regresión lineal es el de mínimos cuadrados. Este método que es óptimo en el caso de errores distribuídos normalmente, es muy sensible a la presencia de outliers. Para remediar ese problema se han desarrollado otros métodos de estimación llamados métodos robustos, los cuales se ven poco afectados por la presencia de datos atípicos. Una medida de la robustez de un estimador es su punto de ruptura. Entre los estimadores de regresión robustos se encuentran los LTS, LMS y los S estimadores. Estos estimadores son equivariantes por transformaciones afines, de regresión, y de escala y además tiene un alto punto de ruptura. El inconveniente que presenta su calculo es que requiere muchas horas de computadora. Rouseeuw y Van Driessen desarrollaron un algoritmo, llamado Fast -LTS, que mejora la velocidad de cálculo del estimador de mínimos cuadrados podados. El objetivo de este trabajo es desarrollar un nuevo algoritmo, análogo al Fast-LTS, para computar S estimadores. Del mismo modo que el algoritmo desarrollado por Rouseeuw, este nuevo algoritmo está basado en el mejoramiento local de los nuevos estimadores iniciales. Esto permite una significativa reducción del número de candidatos requeridos para obtener una buena aproximación de la solución óptima. Se ha realizado un estudio de simulación que ha mostrado que los S estimadores calculados con el algoritmo Fast-S, son comparativamente mejores a los estimadores LTS calculados con el algoritmo Fast-LTS. Algunas de las ventajas del nuevo algoritmo son: 1) Menor porcentaje de muestras afectadas por los datos atípicos. 2) Menor error cuadrático medio. 3) Menor tiempo de cómputo. Regression analysis is an important statistical tool that is applied in most sciences. The purpose of regression analysis is to fit equations to observed variables. The most commonly regression technique is the least squares method, generally adopted because of tradition and easier computation. However these method is very sensitive to the presence of atypical points in the sample. An observation is an atypical point or outlier if it does not follow the model. To remedy this problem the robust mothods have been developed that are not so easuly affected by outliers. One mesure of robustness of an estimate is its breakdown point. Heuristically, the breakdown point is the minimun fraction of arbitrary outliers that can take the estimate beyond any limit. The breakdown point as an asymptotic concept has been introduced by Hampel (1971). Donoho and Huber (1983) gave the corresponding finite sample notion. A desirable property for regression estimates is that the estimate be equivariant with respect to affine, regression and scale transformations. Estimates are computationally expensive, and the corresponding algorithms become unfasible for moderately large number of regressors. In this thesis we propose an algorithm for computing S-estimates, analogous to the algorithm of Rousseeuw and Van Driessen (Fast-LTS) to improve the computational speed of the LTS-estimate. The new algorithm, that we call "fast-S", is based on a "local improvement" step of the re-sampling initial candidates. This allows a substantial reduction of the number of candidates requiered to obtain a good approximation to the optimal solution. We performed a simulation study wich shows that S-estimators computed with the fast-S algorithm compare favourably to the LTS estimator computed with the fast-LTS algorithm. Fil: Ambrosio, Beatriz. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. 2004-11 Tesis de Maestría PDF Español info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar https://hdl.handle.net/20.500.12110/tesis_n3765_Ambrosio
institution Universidad de Buenos Aires
institution_str I-28
repository_str R-134
collection Biblioteca Digital - Facultad de Ciencias Exactas y Naturales (UBA)
language Español
orig_language_str_mv Español
description El método más comunmente usado para estimar los coeficientes de una regresión lineal es el de mínimos cuadrados. Este método que es óptimo en el caso de errores distribuídos normalmente, es muy sensible a la presencia de outliers. Para remediar ese problema se han desarrollado otros métodos de estimación llamados métodos robustos, los cuales se ven poco afectados por la presencia de datos atípicos. Una medida de la robustez de un estimador es su punto de ruptura. Entre los estimadores de regresión robustos se encuentran los LTS, LMS y los S estimadores. Estos estimadores son equivariantes por transformaciones afines, de regresión, y de escala y además tiene un alto punto de ruptura. El inconveniente que presenta su calculo es que requiere muchas horas de computadora. Rouseeuw y Van Driessen desarrollaron un algoritmo, llamado Fast -LTS, que mejora la velocidad de cálculo del estimador de mínimos cuadrados podados. El objetivo de este trabajo es desarrollar un nuevo algoritmo, análogo al Fast-LTS, para computar S estimadores. Del mismo modo que el algoritmo desarrollado por Rouseeuw, este nuevo algoritmo está basado en el mejoramiento local de los nuevos estimadores iniciales. Esto permite una significativa reducción del número de candidatos requeridos para obtener una buena aproximación de la solución óptima. Se ha realizado un estudio de simulación que ha mostrado que los S estimadores calculados con el algoritmo Fast-S, son comparativamente mejores a los estimadores LTS calculados con el algoritmo Fast-LTS. Algunas de las ventajas del nuevo algoritmo son: 1) Menor porcentaje de muestras afectadas por los datos atípicos. 2) Menor error cuadrático medio. 3) Menor tiempo de cómputo.
format Tesis de Maestría
author Ambrosio, Beatriz
spellingShingle Ambrosio, Beatriz
Algoritmos rápidos para computar estimadores robustos
author_facet Ambrosio, Beatriz
author_sort Ambrosio, Beatriz
title Algoritmos rápidos para computar estimadores robustos
title_short Algoritmos rápidos para computar estimadores robustos
title_full Algoritmos rápidos para computar estimadores robustos
title_fullStr Algoritmos rápidos para computar estimadores robustos
title_full_unstemmed Algoritmos rápidos para computar estimadores robustos
title_sort algoritmos rápidos para computar estimadores robustos
publishDate 2004
url https://hdl.handle.net/20.500.12110/tesis_n3765_Ambrosio
work_keys_str_mv AT ambrosiobeatriz algoritmosrapidosparacomputarestimadoresrobustos
_version_ 1807322194076762112