Université Sorbonne Nouvelle - Paris 3

☰

ANR - Ecritures

ANR - Ecritures >> ANR - Ecritures >> Tâches

TACHE 4

Cette phase de travail est consacrée à l'analyse génétique du sous-corpus 2 recueilli par l'interface Inputlog, ce qui permet d'enregistrer non seulement l'ensemble des opérations de réécriture « en temps réel », mais aussi des données physiques, comme les mouvements oculaires du scripteur (importantes notamment dans le cadre de la révision du document). Les données qualitatives de l'étude seront complétées par des données textométriques issues de l'analyse contrastive des brouillons successifs d'un seul et même texte grâce à Edite-Medite (LIP6, Paris 6 ; 2007) ; l'interprétation des résultats obtenus s'en suit. Les résultats visent à constituer un apport scientifique en vue du développement de logiciels de suivi de rédaction.

L'analyse génétique du corpus en question porte sur les réflexions sur la genèse des textes, sur les stratégies d'écriture, la planification, la progression textuelle et l'avant-texte des corpus en observant les traces du processus de création textuelle sur les brouillons. Ces traces s'inscrivent - dans le temps de leur production - dans une chronologie orientée. Une fois figées, leur chronologie est à retrouver. C'est à cette reconstitution que nous nous attachons dans l'objectif d'interpréter le processus de création. Dépliement du manuscrit dans ses différents états et ordonnancement temporel de l'écriture du texte sont ainsi les deux versants interliés de l'analyse génétique. Sa pratique consiste à conduire parallèlement deux séries d'observations :

celles liées au dépliement des différentes strates d'écriture, grâce à l'élucidation des traces graphiques laissées par l'écrivain sur le manuscrit : analyse.
celles liées à la découverte des différentes étapes d'écriture, c'est-à-dire de l'ordre chronologique des gestes de scription et d'élaboration du texte : interprétation.

Pour pouvoir conduire au bout les deux séries d'observations mentionnées, l'examen lent et exhaustif de la suite des brouillons s'impose. Le programme EDITE a été élaboré afin d'établir un relevé systématique et une étude des transformations processuelles du travail de réécriture. L'objectif est de fournir des données exhaustives et pertinentes sur lesquelles pourrait être établie une interprétation génétique du processus d'écriture.
Pour cette étude systématique, un logiciel MEDITE est appliqué qui permet de comparer deux états successifs de textes en indiquant les transformations énonciatives et linguistiques opérées de l'un à l'autre. L'algorithme principal de ce logiciel comprend trois phases : la détection des blocs communs maximaux disjoints, l'identification des pivots et des déplacements et le calcul des suppressions, insertions et remplacements. Une interface visualise les résultats obtenus et permet à l'utilisateur d'inscrire un commentaire. Ces transformations élémentaires (déplacements, insertions, suppressions et remplacements de blocs de caractères) peuvent ensuite être associées aux catégories syntaxiques ou sémantiques des mots ou des groupes de mots pour donner naissance à des opérations linguistiques de réécriture (déplacement d'un adverbe, remplacement d'un mot par un hyperonyme ou par un hyponyme, suppression ou ajout d'un adjectif etc. ; Fenoglio et Boucheron 2002, Fenoglio 2003). L'enjeu du programme est l'étude systématique de la production scripturale processuelle d'une personne qui écrit. Son objet spécifique est la réécriture dans sa suite diachronique et dans son processus énonciatif. Par le biais de MEDITE, nous disposons d'un matériau exhaustif, immédiatement visible et surtout dont la comparaison est directement accessible et productive.

Etapes d'analyse :
Etablissement de la macrogenèse d'un ensemble de brouillons, c'est-à-dire restitution de l'ordre des brouillons ; constitution des dossiers de coprus à analyser dans MEDITE ; chargement du corpus dans le logiciel ; analyse et interprétation des résultats.

Le calendrier de cette tâche prend en compte les éventuels risques de retard dus aux difficultés de recueil du sous-corpus 2. Dans ce cas, la phase de collecte de ce sous-corpus (c'est-à-dire, son extraction des postes des travailleurs sociaux concernés) basculerait de la tâche 1 à la tâche 4.

Livrables : analyse psycholinguistique de brouillons produits via l'interface Inputlog ; article dans une revue de psycholinguistique ; diagnostic et propositions pour le développement des logiciels de suivi de rédaction (en collaboration avec les tâches 3-8).

mise à jour le 6 octobre 2011