Análisis de datos para potenciar las ventas de productos de pesca deportiva

El presente trabajo de tesis desarrolla un pipeline de ingeniería de datos en Python, independiente del sistema de carga de la empresa, para limpieza, transformación y predicción de ventas en un comercio de artículos de pesca. Partiendo de un histórico de más de 120 000 registros sin corregir, se im...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autor principal: Molina Pascual, Facundo José
Otros Autores: Aballay, Patricia
Formato: acceptedVersion Tesis de grado Trabajo final de grado
Lenguaje:Español
Publicado: Universidad Católica de Salta. Facultad de Ingeniería (Salta) 2024
Materias:
Acceso en línea:https://bibliotecas.ucasal.edu.ar/opac_css/index.php?lvl=cmspage&pageid=24&id_notice=81020
Aporte de:
Descripción
Sumario:El presente trabajo de tesis desarrolla un pipeline de ingeniería de datos en Python, independiente del sistema de carga de la empresa, para limpieza, transformación y predicción de ventas en un comercio de artículos de pesca. Partiendo de un histórico de más de 120 000 registros sin corregir, se implementó tres enfoques de modelado de series temporales ARIMA(2,1,1), NAIVE y validación cruzada y se compararon cuantitativamente mediante MAPE, MAE y RMSE . ● El modelo ARIMA(2,1,1) redujo el MAPE en un 35 % frente a NAIVE (pasando de 13,1 % a 8,5 %), lo que se traduce en una precisión de predicción superior al 90 %, permitiendo planificar compras con antelación y minimizar faltantes y sobrestocks. ● El submódulo de preprocesamiento automatizado acelera la limpieza de datos en un 30 % (de 40 h a 28 h mensuales), si bien la calidad de los datos de origen sigue siendo un factor crítico que requiere validación externa. Estos resultados demuestran la robustez y replicabilidad de una solución de ingeniería de datos modular, capaz de ofrecer predicciones fiables aun cuando los sistemas de carga originales proporcionan información incorrecta o incompleta.