Recuperación y clasificación automática de información, resultados actuales y perspectivas futuras

En este trabajo se presenta una herramienta de recolección de información abierta que, mediante la combinación de ontologías y tesauros, brindará información clasificada y unificada en un repositorio temático a los usuarios del Servicio de Difusión de la Creación Intelectual (SeDiCI); esta clasifica...

Descripción completa

Guardado en:
Detalles Bibliográficos
Autores principales: De Giusti, Marisa Raquel, Villarreal, Gonzalo Luján, Sobrado, Ariel, Vosou, Agustín
Formato: Objeto de conferencia
Lenguaje:Español
Publicado: 2009
Materias:
Acceso en línea:http://sedici.unlp.edu.ar/handle/10915/5554
Aporte de:
id I19-R120-10915-5554
record_format dspace
institution Universidad Nacional de La Plata
institution_str I-19
repository_str R-120
collection SEDICI (UNLP)
language Español
topic Bibliotecología
Informática
Sistemas de Información
Recuperación de información
spellingShingle Bibliotecología
Informática
Sistemas de Información
Recuperación de información
De Giusti, Marisa Raquel
Villarreal, Gonzalo Luján
Sobrado, Ariel
Vosou, Agustín
Recuperación y clasificación automática de información, resultados actuales y perspectivas futuras
topic_facet Bibliotecología
Informática
Sistemas de Información
Recuperación de información
description En este trabajo se presenta una herramienta de recolección de información abierta que, mediante la combinación de ontologías y tesauros, brindará información clasificada y unificada en un repositorio temático a los usuarios del Servicio de Difusión de la Creación Intelectual (SeDiCI); esta clasificación permitirá optimizar considerablemente las búsquedas dentro del portal. SeDiCI posee actualmente una gran cantidad de documentos con una sintaxis y catalogación correctas, pero carece de relaciones semánticas entre los mismos. Esta falta de relaciones semánticas genera mayores esfuerzos por parte de los usuarios para vincular documentos unos con otros, a fin de filtrar y clasificar los resultados de una consulta a partir de un dominio específico. Con el objeto de ayudar a los usuarios de SeDiCI a encontrar información pertinente, se propone aquí la incorporación de una herramienta capaz de establecer relaciones semánticas entre los documentos. Esta herramienta constará de dos módulos: el primero estará encargado de recolectar información abierta de interés mediante un agente que navega recursivamente a través de las URLs de los documentos localizados; el segundo módulo será capaz de identificar las páginas marcadas junto a sus etiquetas, y proveer un conjunto de reglas para extraer la información y guardarla en un fichero RDF. A continuación se realizará un proceso de homogeneización entre los términos encontrados, clasificando la información en función de una ontología de dominio. El material recolectado poblará de este modo la ontología, sumándose al repositorio semántico. Para las primeras pruebas de esta herramienta, se utilizará el repositorio propio de SeDiCI, junto con una operación de marcado automática. Una vez que los documentos hayan sido vinculados semánticamente, se proveerá un buscador capaz de aprovechar estas nuevas relaciones-compuestas por clases y subclases-dentro de la ontología lo cual resultará en una considerable mejora en el proceso de organización y entrega de información pertinente al usuario.
format Objeto de conferencia
Objeto de conferencia
author De Giusti, Marisa Raquel
Villarreal, Gonzalo Luján
Sobrado, Ariel
Vosou, Agustín
author_facet De Giusti, Marisa Raquel
Villarreal, Gonzalo Luján
Sobrado, Ariel
Vosou, Agustín
author_sort De Giusti, Marisa Raquel
title Recuperación y clasificación automática de información, resultados actuales y perspectivas futuras
title_short Recuperación y clasificación automática de información, resultados actuales y perspectivas futuras
title_full Recuperación y clasificación automática de información, resultados actuales y perspectivas futuras
title_fullStr Recuperación y clasificación automática de información, resultados actuales y perspectivas futuras
title_full_unstemmed Recuperación y clasificación automática de información, resultados actuales y perspectivas futuras
title_sort recuperación y clasificación automática de información, resultados actuales y perspectivas futuras
publishDate 2009
url http://sedici.unlp.edu.ar/handle/10915/5554
work_keys_str_mv AT degiustimarisaraquel recuperacionyclasificacionautomaticadeinformacionresultadosactualesyperspectivasfuturas
AT villarrealgonzalolujan recuperacionyclasificacionautomaticadeinformacionresultadosactualesyperspectivasfuturas
AT sobradoariel recuperacionyclasificacionautomaticadeinformacionresultadosactualesyperspectivasfuturas
AT vosouagustin recuperacionyclasificacionautomaticadeinformacionresultadosactualesyperspectivasfuturas
bdutipo_str Repositorios
_version_ 1764820477002383361