ED 622 >> Activités Scientifiques >> Samedi de l'ED

Annotations syntaxiques sur corpus : enjeux et perspectives

le 14 mars 2015
8h30-13h

affiche annotations syntaxiques sur corpus.jpg

Matinée organisée par JEANNE-MARIE DEBAISIEUX (UMR 8094 - LATTiCe, Paris 3) Cycle des samedis de l’Ecole Doctorale 268 « Langage et langues »

Programme

  • 8h30 : Accueil
  • 9h - 10h20 : BAS AARTS (University College London) : Syntactic corpus annotation : the case in favour.
  • 10h20 - 11h : SOPHIE PREVOST (UMR 8094 - LATTiCe, ENS/Paris3) : Annotation de textes anciens.
  • 11h - 11h15 : Pause café
  • 11h20 -12 h : SYLVAIN KAHANE (PUMR 7114 - MoDyCo, Université Paris Ouest Nanterre -La Défense) : Annotation de corpus oraux : de l’annotation manuelle à l’annotation automatique.
  • 12h - 12h40 : ISABELLE TELLIER (UMR 8094 - LATTiCe, Université Sorbonne Nouvelle - Paris 3) : Apprentissage automatique d’annotations.
 
Présentation

La constitution de ressources de grande taille en  linguistique de corpus a entraîné  le développement d’outils nouveaux de traitement semi-automatiques pour leur enrichissement par des annotations qu’il était devenu impossible de faire à la main. La journée sera consacrée aux méthodologies d’annotations  de type syntaxique et aux différents types d’exploitation que peut en faire le linguiste.  Les possibilités  de recherches qu’offrent les corpus annotés seront illustrées par des travaux anglo-saxons, riches d’une longue expérience en ce domaine. La conférence d’ouverture du Prof.  Bas Aarts (University College London) montrera ainsi par des exemples précis l'apport des recherches sur corpus annotés au développement de la théorie linguistique. Seront abordées ensuite les avancées et les difficultés que présente l’annotation syntaxique de corpus de français non standard.  La communication de Sophie Prévost (LATTiCe) portera sur la méthodologie d’annotation d’un corpus de langue ancienne le Syntactic Reference Corpus of Medieval French SRCMF et les possibilités de renouveau des études syntaxiques qu’apporte un tel outil. Sylvain Kahane (MoDyCo) exposera les difficultés d’établir un système d’annotation reflétant la spécificité des corpus oraux et les problèmes techniques  qu’implique le passage d’une annotation manuelle (projet Rhapsodie) à une annotation semi-automatique (projet Orfeo). La communication d’Isabelle Tellier (LATTiCe) montrera comment les systèmes d’apprentissage permettent de développer des annotations existantes.

 

Type :
Conférence
Lieu(x) :
DiFLE, Centre Sorbonne, 46 rue Saint-Jacques, 75005 – 3e étage, salle M

mise à jour le 7 septembre 2015