Contribution à la définition d’une approche d’indexation sémantique de documents textuels
No Thumbnail Available
Date
2014
Authors
Journal Title
Journal ISSN
Volume Title
Publisher
Abstract
Les systèmes de recherche d’information classiques reposent sur l'indexation par les mots-clés pour représenter le contenu des documents et requêtes. Dans de tels systèmes, les documents sont sélectionnés par un processus de recherche à partir du nombre de mots-clés qu’ils partagent avec la requête. Ce processus, basé sur l’appariement lexical, peut réduire la précision des résultats de la recherche si les sens des mots communs dans la requête et les documents sont différents. L’indexation sémantique tente de pallier à ce problème en offrant une représentation par les sens des mots. Le but étant de retrouver des documents sémantiquement pertinents à une requête utilisateur. Dans ce présent travail, nous proposons une approche d’indexation sémantique qui s’appuie sur les sens des mots, ou concepts, dans la représentation des documents et requêtes. Ces concepts sont identifiés par des techniques de désambiguïsation des sens des mots en utilisant njointement les ressources linguistiques WordNet et son extension aux domaines WordNetDomains comme sources d’évidence. Nous proposons en outre, la pondération des termes des index sémantiques par une nouvelle définition de la centralité d’un concept. Les concepts pondérés sont ensuite représentés dans un modèle de recherche qui repose sur une évaluation sémantique de la pertinence d’un document pour une requête donnée. L’évaluation expérimentale de notre modèle de RI sémantique proposé a montré des résultats très satisfaisants
Description
154 p. : ill. ; 30 cm
Keywords
Recherche de l'information, Moteurs de recherche, Concept, Indexation sémantique, Bases de données :Interrogation
