Clesthia >> CLESTHIA >> Activités scientifiques

Recherche

Analyser informatiquement des grands corpus d’écrits scolaires: problèmes de transcription, d’annotation et de traitement.

le 18 mars 2015
9h30-17h

Journée d’études organisée par le groupe Écriture Scolaire (EA 7345 CLESTHIA)

Affiche-1.jpg

Présentation de la journée

Les écrits des élèves suscitent un intérêt grandissant chez de nombreux chercheurs appartenant à des domaines ou des paradigmes de recherche aussi variés que la linguistique, la psycholinguistique, la sociolinguistique et la didactique du français. Cet intérêt s’explique à la fois par la singularité de l’objet discursif qu’ils constituent et par la rareté des études empiriques appuyées sur des corpus de grande envergure. Malgré les avancées considérables des outils informatiques d’analyse de textes et les méthodologies liées aux grands corpus oraux, le traitement quantitatif des données langagières émanant de scripteurs débutants ou en cours d’apprentissage est difficile du fait du caractère linguistiquement peu normé (ou autrement normé) de leurs productions. Il est urgent de remédier à cette lacune: le travail sur grand corpus remet en question de l'étude de cas dits "exemplaires" au profit d'une vision panoramique révélant, grâce à l'informatique statisticienne, de grandes tendances scripturales invisibles à l'œil nu. Les retombées dans le domaine de l'éducation de masse sont importantes, à commencer par la possibilité d’aider les programmes scolaires de la nation à coller à la réalité de besoins quantifiés à très grande échelle.

Dans le cadre de son opération de recherche Analyse linguistique de l’écriture scolaire (ECRISCOL) le laboratoire Clesthia de l’université Paris 3 la Sorbonne Nouvelle propose une journée de travail sur la question de la mise à disposition et du traitement des écrits scolaires. Cette journée se déroulera en deux temps :
 

  • Premier temps: interventions sur les spécificités des corpus d’écrits d’élèves: constitution, visée des recherches sur ce type de corpus, études génétiques et longitudinales.
  •  Deuxième temps: interventions axées sur le traitement informatique des données: mise à disposition en ligne, traitement lexical et morpho-syntaxique.

Une table ronde finale avec des représentants des équipes travaillant sur ce type de corpus permettra de faire émerger les questionnements et d’y apporter quelques réponses.

Plusieurs questionnements peuvent être envisagés  (liste non close) :
 

  • Mode de présentation des données dans une base: scan des copies, transcription diplomatique vs linéaire, annotation pour traitement informatique, etc.)
  • Norme, mise aux normes: quelle(s) interface(s) entre le matériau disponible et les exigences des outils informatiques ?
  • Aspects génétiques de l’écriture: la place des notes, l’analyse des biffures et ratures, la saisie des brouillons et de l’ensemble des avant-textes d’un écrit d’élève. Pour les copies d’élèves se posent de manière aiguë, en plus de la textualisation, tous les problèmes liés à l’acquisition du système linguistique, en particulier les unités de segmentation, la ponctuation, l’ensemble des données (ortho)graphiques.
  • Prise en compte des contextes didactiques: démarche, consignes, supports, modes de production et d’édition...
Comité d’organisation

  • Jacques David (Université de Cergy, EA 1392 CRTF)
  • Claire Doquet (Université Paris 3, EA 7345 Clesthia)
  • Serge Fleury (Université Paris 3, EA 7345 Clesthia)
  • Li Yilun (Université de Paris 3, EA 7345 Clesthia)

Comité scientifique

  • Sonia Branca (Université Paris 3, EA 7345 Clesthia)
  • Catherine Boré (Université de Cergy, EA EMA)
  • Catherine Brissaud (Université Stendhal Grenoble 3, EA 609 Lidilem)
  • Marie-Laure Elalouf (Université de Cergy, EA EMA)
  • Claudine Garcia-Debanc (Université de Toulouse 2, UMR 5263 CLLE)
  • Olivier Lumbroso (Université Paris 3, EA 2288 DILTEC)
  • Franck Neveu (Université Paris Sorbonne, EA 4509 STIH)
  • Sylvie Plane (université Paris 4 Sorbonne, EA 4509 STIH)
  • Marie-Noëlle Roubaud (Université de Aix-Marseille, EA 4671 ADEF)
  • Agnès Steuckardt (Université Montpellier 3, UMR 5267 Praxiling)

 Voir le programme à télécharger ci-contre.


Type :
Colloque / Journée d'études
Contact :
Claire Doquet
Lieu(x) :
Salle Bourjac – 17 rue de la Sorbonne – 75005 Paris

mise à jour le 14 janvier 2017


Documents à télécharger :