Mejora del acceso a Infoleg mediante técnicas de procesamiento automático del lenguaje

En este artículo presentamos una aproximación para la detección Automática de Entidades en textos legales, y su aplicación al corpus InfoLeg. La aproximación se basa en diversas técnicas de Extracción de Información, entre ellas Aprendizaje Automático a partir de ejemplos y reglas creadas manualment...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: Cardellino, Fernando, Cardellino, Cristian, Haag, Karen, Soto, Axel, Teruel, Milagro, Alonso i Alemany, Laura, Villata, Serena
Formato: Objeto de conferencia
Lenguaje:Español
Publicado: 2018
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/71805
http://47jaiio.sadio.org.ar/sites/default/files/SID-6.PDF
Aporte de:
Descripción
Sumario:En este artículo presentamos una aproximación para la detección Automática de Entidades en textos legales, y su aplicación al corpus InfoLeg. La aproximación se basa en diversas técnicas de Extracción de Información, entre ellas Aprendizaje Automático a partir de ejemplos y reglas creadas manualmente. Presentamos un análisis de los diferentes tipos de entidades que se encuentran en los textos, sus realizaciones lingüísticas y sus di ficultades para el análisis automático. El diseño de la solución se basa en las di ficultades propias de estas entidades. En la fase actual de desarrollo de la aproximación hemos anotado manualmente una porción del corpus y hemos desarrollado reglas para anotar casos sencillos automáticamente. Hemos entrenado y evaluado una aproximación basada en aprendizaje automático para casos sencillos, con resultados muy prometedores.