Pour pouvoir conduire au bout les deux séries d'observations mentionnées, l'examen lent et exhaustif de la suite des brouillons s'impose. Le programme EDITE a été élaboré afin d'établir un relevé systématique et une étude des transformations processuelles du travail de réécriture. L'objectif est de fournir des données exhaustives et pertinentes sur lesquelles pourrait être établie une interprétation génétique du processus d'écriture.
Pour cette étude systématique, un logiciel MEDITE est appliqué qui permet de comparer deux états successifs de textes en indiquant les transformations énonciatives et linguistiques opérées de l'un à l'autre. L'algorithme principal de ce logiciel comprend trois phases : la détection des blocs communs maximaux disjoints, l'identification des pivots et des déplacements et le calcul des suppressions, insertions et remplacements. Une interface visualise les résultats obtenus et permet à l'utilisateur d'inscrire un commentaire. Ces transformations élémentaires (déplacements, insertions, suppressions et remplacements de blocs de caractères) peuvent ensuite être associées aux catégories syntaxiques ou sémantiques des mots ou des groupes de mots pour donner naissance à des opérations linguistiques de réécriture (déplacement d'un adverbe, remplacement d'un mot par un hyperonyme ou par un hyponyme, suppression ou ajout d'un adjectif etc. ; Fenoglio et Boucheron 2002, Fenoglio 2003). L'enjeu du programme est l'étude systématique de la production scripturale processuelle d'une personne qui écrit. Son objet spécifique est la réécriture dans sa suite diachronique et dans son processus énonciatif. Par le biais de MEDITE, nous disposons d'un matériau exhaustif, immédiatement visible et surtout dont la comparaison est directement accessible et productive.
Etapes d'analyse :
Etablissement de la macrogenèse d'un ensemble de brouillons, c'est-à-dire restitution de l'ordre des brouillons ; constitution des dossiers de coprus à analyser dans MEDITE ; chargement du corpus dans le logiciel ; analyse et interprétation des résultats.
Le calendrier de cette tâche prend en compte les éventuels risques de retard dus aux difficultés de recueil du sous-corpus 2. Dans ce cas, la phase de collecte de ce sous-corpus (c'est-à-dire, son extraction des postes des travailleurs sociaux concernés) basculerait de la tâche 1 à la tâche 4.
Livrables : analyse psycholinguistique de brouillons produits via l'interface Inputlog ; article dans une revue de psycholinguistique ; diagnostic et propositions pour le développement des logiciels de suivi de rédaction (en collaboration avec les tâches 3-8).