Extraction de la voix dans un signal audio par factorisation en matrices non-négatives semi-supervisée - Sorbonne Université Accéder directement au contenu
Rapport Année : 2015

Extraction de la voix dans un signal audio par factorisation en matrices non-négatives semi-supervisée

Bouvier Damien

Résumé

Ce rapport de stage de 2ème année de master a pour sujet la factorisation en matrices non- négatives pour la séparation de sources audio appliquée à la voix. La contribution principale de ce stage est la réalisation d’une méthode semi-supervisée de séparation de la parole, basée sur un modèle source/filtre et l’intégration de contraintes pour informer la factorisation en matrices non-négatives sur les spécificités du signal de parole. Tout d’abord, un état de l’art sur les méthodes de séparation de parole est présenté, et en parti- culier à propos des méthodes de factorisation en matrices non-négatives et de la spécification de connaissances sur la parole à l’intérieur de ce cadre. Puis, après un rappel des enjeux du stage, la méthode d’apprentissage du modèle de voix et les contraintes intégrées à la factorisation en matrices non-négatives sont présentées ainsi que la structure de l’algorithme proposé. Enfin, les contributions proposées sont évaluées et comparées aux méthodes de l’état de l’art sur une tâche de séparation de la parole en environnement bruité.
Fichier non déposé

Dates et versions

hal-01264830 , version 1 (29-01-2016)

Identifiants

  • HAL Id : hal-01264830 , version 1

Citer

Bouvier Damien. Extraction de la voix dans un signal audio par factorisation en matrices non-négatives semi-supervisée. [Stage] STMS - Sciences et Technologies de la Musique et du Son UMR 9912 IRCAM-CNRS-UPMC. 2015. ⟨hal-01264830⟩
256 Consultations
0 Téléchargements

Partager

Gmail Facebook X LinkedIn More