Aujourd’hui, les outils informatiques font partie intégrante de l’analyse littéraire. Qu’il s’agisse de numérisation de corpus, d’analyses statistiques, ou encore de visualisation de données, ils permettent une nouvelle approche des textes, objective et exhaustive, ainsi que le perfectionnement d’études plus traditionnelles.
Les phrases de Marcel Proust sont-elles réellement plus longues que celles de ses contemporains ? Quels sont les prénoms que Balzac donne le plus souvent à ses personnages ? Comment peut-on caractériser le style de Pascal Quignard ? Quelles sont les couleurs dominantes dans Les Liaisons dangereuses ? Flaubert a-t-il un vocabulaire plus riche que celui de Malraux ? C’est le plus souvent en utilisant les textes sous leur forme numérique et des outils informatiques que l’on pourra répondre à ce type de questions, relevant d’hypothèses spontanées ou de la recherche scientifique. L’objet de cet ouvrage est de présenter les instruments, les ressources et les méthodes qui permettent de constituer un corpus de textes littéraires en vue de son étude informatisée.
Nous proposons ici d’exposer les différentes étapes qui permettent d’analyser un texte avec des outils numériques. Comment récupérer, sous forme numérique, les textes composant un corpus ? Comment préparer un texte ? Quelles corrections ? Quel(s) balisage(s) pour quel(s) logiciel(s) ? En quoi un logiciel de textométrie peut-il être utile ? Quels sont les logiciels de textométrie disponibles ? Ou encore, comment rendre lisibles et accessibles les résultats ainsi obtenus ? Quelles sont les meilleures représentations graphiques ? Quels outils pour mettre en ligne et diffuser les résultats ?
Autant de questions auquel cet ouvrage se propose de répondre.