Apprentissage de Modèles de Langue Neuronaux pour la Recherche d'Information

Nicolas Despres 1 Sylvain Lamprier 1 Benjamin Piwowarski 2
1 MLIA - Machine Learning and Information Access
LIP6 - Laboratoire d'Informatique de Paris 6
2 BD - Bases de Données
LIP6 - Laboratoire d'Informatique de Paris 6
Résumé : La recherche d’information (RI) ad-hoc se heurte à différentes difficultés, notam- ment liées à des discordances de vocabulaire entre requête et documents, ainsi qu’à la prise en compte de dépendances séquentielles entre les termes de la requête. Les récents modèles de langue neuronaux sont capables de capturer différents types de dépendances, grâce à une représentation distribuée des mots, mais nécessitent de gros volumes de données pour être entrainés efficacement. Jusqu’alors, ces modèles n’ont pas été utilisés directement pour des tâches de RI classiques, pour lesquelles l’estimation d’un modèle de langue pour chaque document est requise. Nous proposons une approche basée sur des transformations spécifiques (à chaque do- cument) d’une représentation générique (apprise sur l’ensemble du corpus), pour définir des modèles de langue neuronaux pour la RI ad-hoc.
Type de document :
Communication dans un congrès
Conférence en Recherche d'Infomations et Applications, Mar 2016, Toulouse, France. pp.717-732, 2016
Liste complète des métadonnées

http://hal.upmc.fr/hal-01358680
Contributeur : Benjamin Piwowarski <>
Soumis le : jeudi 1 septembre 2016 - 11:25:36
Dernière modification le : mercredi 21 mars 2018 - 18:58:13

Identifiants

  • HAL Id : hal-01358680, version 1

Collections

Citation

Nicolas Despres, Sylvain Lamprier, Benjamin Piwowarski. Apprentissage de Modèles de Langue Neuronaux pour la Recherche d'Information. Conférence en Recherche d'Infomations et Applications, Mar 2016, Toulouse, France. pp.717-732, 2016. 〈hal-01358680〉

Partager

Métriques

Consultations de la notice

175