Je décrirai en premier lieu un cadre probabiliste Bayésien pour la séparation de sources, et je montrerai comment de nombreuses méthodes de l’état de l’art y apparaissent comme des déclinaisons particulières. Après ce tour d’horizon, je me focaliserai sur le cas des sources audio, qui sont caractérisées par une stationnarité locale. Je présenterai ainsi les différents modèles les plus récents qui ont été proposés pour la modélisation et la séparation de la voix chantée au sein d’un mélange audio multicanal. Cette description sera l’occasion d’aborder les modèles de mélange diffus, qui sont une généralisation récente des mélanges instantanés et convolutifs. Pour finir, je présenterai une technique de séparation de la voix basée sur la séparation de motifs répétitifs. Cette technique suppose que le fonds musical est localement répétitif et permet de très efficacement séparer la voix de la musique dans les productions grand public.
Séparation de sources audio, état de l'art et application à la séparation de la voix chantée
Antoine LIUTKUS, invité par l'équipe Analyse et synthèse du son, dans le cadre de l'offre de poste 0580 en section 61 d'enseignant chercheur, présente :
"Séparation de sources audio, état de l'art et application à la séparation de la voix chantée"
Cet exposé se fera en trois parties.
Je décrirai en premier lieu un cadre probabiliste Bayésien pour la séparation de sources, et je montrerai comment de nombreuses méthodes de l'état de l'art y apparaissent comme des déclinaisons particulières.
Après ce tour d'horizon, je me focaliserai sur le cas des sources audio, qui sont caractérisées par une stationnarité locale. Je présenterai ainsi les différents modèles les plus récents qui ont été proposés pour la modélisation et la séparation de la voix chantée au sein d'un mélange audio multicanal.
Cette description sera l'occasion d'aborder les modèles de mélange diffus, qui sont une généralisation récente des mélanges instantanés et convolutifs.
Pour finir, je présenterai une technique de séparation de la voix basée sur la séparation de motifs répétitifs. Cette technique suppose que le fonds musical est localement répétitif et permet de très efficacement séparer la voix de la musique dans les productions grand public.