Accueil >> Recherche >> Projets & Valorisation

Projet ANR

ANR - ETAPE

Structure(s) de rattachement :
Projets ANR
LPP - Laboratoire de Phonétique et Phonologie - UMR 7018

Composition de l'équipe

Projet financé dans le cadre du programme ANR CONTINT édition 2009
Évaluations en traitement automatique de la parole


Coordinateur: Guillaume GRAVIER
Responsable Sorbonne nouvelle: Cédric GENDROT

6 équipes partenaires sont impliquées dans ce projet. 

Présentation

Le projet ETAPE a pour objectif premier la mise en oeuvre d'une campagne d'évaluation des technologies vocale pour la transcription automatique de la parole spontannée dans les flux télévisés. Si, comme l'ont montré les précédentes campagnes d'évaluation organisées en France, les technologies de la parole ont atteint une certaine maturité pour des contenus contrôlés, il n'est à l'heure actuelle pas possible d'évaluer de manière objective les performances de ces technologies sur des données représentatives des contenus télévisés. En particulier, la parole spontanée, parfois superposée, dans des fonds sonores variés (studio, intérieur, extérieur) est très fortement présente dans ces contenus et pose problème aux technologies actuelles. Le projet ETAPE s'inscrit pour une part dans la continuité des campagnes ESTER - en ce qu'elles ont stimulé les équipes de  recherche et permis des progrès considérables dans le domaines des technologies du traitement de la parole (transcription automatique, structuration par le locuteur ou encore détection des entités nommées) grâce notamment à la mise disposition et la diffusion de corpus annotés et enrichis - tout en définissant de nouveaux enjeux comme la parole spontanée, la diversité des contenus ou encore le traitement des zones de parole superposée.    Outre une mesure objective des performances des technologies vocales sur des contenus réalistes et proches d'applications sensibles, le projet affiche l'objectif de mettre à la disposition de la communauté scientifique un corpus de parole spontanée annoté et enrichie par des alignements phonétiques et des arbres syntaxiques.    Les enjeux du projet sont de faire progresser les technologies du traitement automatique de la parole par le biais de la production de ressources, de la définition de nouveaux problèmes, de l'évaluation et de la structuration de la communauté scientifique. Un enjeu important est également de faire émerger de nouveaux axes de recherche. L'implication de plusieurs communautés scientifiques, notamment du domaine des sciences humaines et sociales, l'enrichissement des annotations par des alignements phonetiques et des annotations syntaxique et l'évaluation de tâches à la frontière entre traitement de la parole et traitement des langues sont autant de facteurs favorisant l'émergence d'axes de recherche transverses.    Au-delà des enjeux scientifiques immédiats, le projet vise à favoriser et à promouvoir l'utilisation des technologies de la parole, pour la langue française, dans des applications de structuration et d'accès aux contenus numériques.

Informations complémentaires

Durée du projet 2 ans et demie (automne 2009 - printemps 2012)

mise à jour le 12 septembre 2017