Geocodificación de domicilios de tipo catastral en el Gran Resistencia mediante el uso de técnicas de Procesamiento del Lenguaje Natural

"Esta tesis aborda el problema de la geocodificación de domicilios catastrales en la Provincia del Chaco, Argentina, específicamente en las localidades de Resistencia, Barranqueras y Fontana. El objetivo principal fue desarrollar un método para transformar textos de direcciones catastrales, uti...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autor principal: Solis, Juan Ignacio Pedro
Formato: Tesis de maestría
Lenguaje:Español
Publicado: 2025
Materias:
Acceso en línea:https://hdl.handle.net/20.500.14769/5071
Aporte de:
Descripción
Sumario:"Esta tesis aborda el problema de la geocodificación de domicilios catastrales en la Provincia del Chaco, Argentina, específicamente en las localidades de Resistencia, Barranqueras y Fontana. El objetivo principal fue desarrollar un método para transformar textos de direcciones catastrales, utilizando la nomenclatura de barrio, manzana y parcela, en coordenadas geográficas. Para ello, se emplearon técnicas de Procesamiento de Lenguaje Natural (PLN) y Minería de Textos en la limpieza, tokenización, parseo, normalización y estandarización de estas direcciones, con un enfoque particular en el uso de algoritmos de similitud de textos para el emparejamiento con un conjunto de datos de referencia. Los resultados obtenidos sobre una muestra de 1.121 domicilios mostraron que el modelo logró geolocalizar el 57% de los domicilios muestreados. Sin embargo, los resultados fueron heterogéneos según el análisis de cada localidad y la fuente de aquellos. Los hallazgos sugieren que este método puede ser una herramienta innovadora para la ubicación espacial de direcciones con ésta estructura gramatical particular, y es posible extrapolarlo a otros contextos locales que compartan el mismo problema." "This thesis addresses the problem of geocoding parcel addresses in the Province of Chaco, Argentina, specifically in the localities of Resistencia, Barranqueras and Fontana. The main objective was to develop a method to transform parcel address texts, using the nomenclature of neighborhood, block, and parcel, into geographic coordinates. For this purpose, Natural Language Processing (NLP) and Text Mining techniques were employed in the cleaning, tokenization, parsing, normalization, and standardization of these addresses, with a particular focus on the use of text similarity algorithms for matching with a reference dataset. The results obtained from a sample of 1,121 addresses showed that the model was able to geolocate 57% of the sampled addresses. However, the results were heterogeneous according to the analysis of each locality and the source of those addresses. The findings suggest that this method can be an innovative tool for the spatial location of addresses with this particular grammatical structure, and it is possible to extrapolate it to other local contexts that share the same problem."