Cette documentation n’est plus mise à jour et est susceptible d’être supprimée.
Oculus Lipsync mappe la parole humaine sur un ensemble de formes de bouche, appelées « visèmes », qui sont l’équivalent visuel des phonèmes. Chaque visème représente la forme de la bouche pour un ensemble spécifique de phonèmes. Petit à petit, ces visèmes sont interpolés pour simuler le mouvement naturel de la bouche. Vous trouverez ci-dessous des images fournies à titre de référence que nous avons utilisées pour créer des formes dans nos démos. Pour chaque ligne, nous donnons le nom du visème, des exemples de phonèmes qui lui correspondent, des exemples de mots, mais aussi des images montrant à la fois une représentation non marquée et exagérée de ce visème. Nous espérons que vous trouverez ces informations utiles pour créer vos propres modèles. Pour plus d’informations sur ces 15 visèmes et sur la façon dont ils ont été sélectionnés, veuillez lire la documentation suivante : Viseme MPEG-4 Standard (Normes MPEG-4 des visèmes)
Exemple animé
L’animation qui suit montre les visèmes correspondant aux images de référence.
Images de référence
Vous pouvez cliquer sur chaque image pour l’agrandir. Seul un sous-ensemble de phonèmes est présenté pour chaque visème.