Modélisation de la coarticulation labiale : mise en oeuvre sur une tête parlante

Vincent Robert

Thèse Année : 2008

Modeling labial coarticulation : implementation for a talking head

Modélisation de la coarticulation labiale : mise en oeuvre sur une tête parlante

(1)

Vincent Robert

Fonction : Auteur

Laboratoire Lorrain de Recherche en Informatique et ses Applications

Résumé

This thesis comes within the scope of talking heads. We are particularly interested in the prediction of labial and jaw coarticulation movements. After analyzing intra and inter speaker variability using two corpora, we defined a prediction algorithm for anticipatory coarticulation based on phonetic rules which takes into account interactions between articulators. We then proposed a solution to estimate labial and jaw movements using a one speaker corpus. It consists in concatenating elementary VC...CV sequences selected by our prediction algorithm and either extracted from the corpus or rebuilt by completion. We modeled articulatory movements using sigmoids which offer the advantage of considerably reducing the model size and which are adaptable to speaking rate or articulatory strategies. Additionally, sigmoids are able to keep distinctive contrasts between neighboring segments as well as intrinsic characteristics of the sounds. With the aim of estimating the quality of our synthesis process, we measured differences between real and predicted data for all the sentences of the corpus et we compared our solution with Cohen and Massaro 's algorithm. It turns out that our solution is better for specific VCCV sequences in which anticipation is more complex.

Cette thèse s'inscrit dans une étude sur l'élaboration d'une tête parlante. Nous nous intéressons tout particulièrement à la prédiction du mouvement de coarticulation des lèvres et de la mâchoire. Après avoir analysé les variations intra et interlocuteur des paramètres labiaux de deux corpora audiovisuels, nous avons conçu un algorithme de prédiction de la coarticulation basé sur des règles phonétiques et prenant en considération l'interaction entre les articulateurs. Nous avons ensuite proposé une technique pour synthétiser les mouvements articulatoires des lèvres et de la mâchoire en utilisant un corpus monolocuteur. Le principe de base est la concaténation de séquences élémentaires de type VC...CV qui ont été jugées pertinentes par notre algorithme de prédiction phonétique, et qui sont soit extraites du corpus, soit obtenues par complétion. Nous avons modélisé les mouvements articulatoires par des sigmoïdes qui offrent l'avantage de réduire considérablement la taille du modèle construit et permettent de s'adapter facilement à des vitesses d'élocution ou des stratégies articulatoires particulières tout en conservant les contrastes distinctifs entre les sons successifs et leurs caractéristiques intrinsèques. Afin d'estimer la qualité de notre synthèse, nous avons mesuré les différences entre les signaux réels et synthétisés sur l'ensemble des phrases du corpus et nous avons comparé notre solution avec l'algorithme de Cohen et Massaro. Nous avons montré que notre synthèse est meilleure pour certaines séquences spécifiques de type VCCV où l'anticipation est plus complexe.

Mots clés

Coarticulation Tête parlante Parole-Modèles mathématiques Traitement automatique de la parole Articulation temporomandibulaire

Domaines

Autre [cs.OH] Autre

Fichier principal

SCD_T_2008_0077_ROBERT.pdf (4.18 Mo)

Origine	Fichiers produits par l'(les) auteur(s)

Thèses UL : Connectez-vous pour contacter le contributeur

https://hal.univ-lorraine.fr/tel-01748431

Soumis le : jeudi 29 mars 2018-11:34:54

Dernière modification le : lundi 11 septembre 2023-17:41:19

Archivage à long terme le : vendredi 14 septembre 2018-08:12:26

Dates et versions

tel-01748431 , version 1 (29-03-2018)

Identifiants

HAL Id : tel-01748431 , version 1

Citer

Vincent Robert. Modélisation de la coarticulation labiale : mise en oeuvre sur une tête parlante. Autre [cs.OH]. Université Henri Poincaré - Nancy 1, 2008. Français. ⟨NNT : 2008NAN10077⟩. ⟨tel-01748431⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

CNRS INRIA UNIV-LORRAINE LORIA THESES-UL

50 Consultations

47 Téléchargements

Modeling labial coarticulation : implementation for a talking head

Modélisation de la coarticulation labiale : mise en oeuvre sur une tête parlante

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager