Prise en compte des liens pour améliorer la recherche d'information structurée
No Thumbnail Available
Date
2009
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Dans cet article nous présentons deux adaptations de l’algorithme PageRank aux collections de documents XML et les résultats d’expérimentation obtenus pour la collection Wikipedia utilisée dans INEX 2007. Ces adaptations que nous appelons "DOCRANK" et "HITS_docrank" permettent un reclassement des résultats renvoyés par l’exécution de base (base run) pour en améliorer la qualité. Nos expérimentations sont effectuées sur les résultats renvoyés par les trois systèmes les mieux classés pour la tâche "Focused" d’INEX 2007. Les évaluations que nous avons menés ont montrés des améliorations de la qualité des résultats (voir très significatives pour certaines "topics", ex : 491, 521, etc.). La meilleure amélioration obtenue pour les résultats renvoyés par le système de l’université DALIAN (pour l’ensemble des 107 topics d’INEX 2007) était de l’ordre de 3.78%
Description
Keywords
Recherche d’information structurée (RIS), XML, liens XML, INEX
