Alignement longitudinal pour l'étude génétique de brouillons d'écrivains
Logiciel développé par
Adrien LardilleuxPrésentation
Allongos produit, à partir d'un fichier texte contenant tous les états d'un texte, séparés par de balises :
- un fichier d'alignement au format TMX ;
- un fichier de visualisation au format HTML ;
- éventuellement : 4 fichiers Gnuplot (.gp) permettant d'obtenir 4 graphiques (1 chacun).
Nécessite Python 3 et Java.
Installation
Allongos est écrit en Python 3, et nécessite le programme tercom (présent dans le présent paquetage, ou téléchargeable à l'adresse
http://www.cs.umd.edu/~snover/tercom/), lui-même écrit en Java.
Installer Python 3.x en le téléchargeant à partir de cette page :
http://www.python.org/download/Java est installé par défaut sur la plupart des machines, ou téléchargeable ici :
http://www.java.com/en/download/Les installateurs de ces deux logiciels devraient configurer automatiquement les environnements Python et Java (les exécutables "python3" et "java" doivent être dans la variable PATH).
Téléchargement
Allongos est disponible dans cette
archive [ZIP - 68 Ko].
Contenu de l'archive
- fwords.txt : liste de mots fonctionnels du français, utilisée par le script allongos_lexico2tmx.py. Un autre fichier peut être passé au script avec l'option -f (par défaut, le script cherche ce fichier dans le répertoire courant).
- allongos_lexico2mx.py : script Python qui convertit un fichier d'entrée au format Lexico en un fichier au format "pra" (sortie de TER) en fichier d'alignement au format TMX.
- allongos_tmx2html.py : script Python qui convertir un fichier d'alignement au format TMX en fichier de visualisation au format HTML, et produit en plus les 4 fichiers Gnuplot si l'option -g est passée.
- tercom.7.25.jar : TER, appelé par allongos_lexico2tmx.py et allongos_tmx2html.py. Un autre jar peut être passé au script avec l'option -t (par défaut, le script cherche ce fichier dans le répertoire courant).
- example.txt, et autres example.* : Exemple de fichier d'entrée, et fichiers de sortie correspondants.
Utilisation
Allongos s'utilise exclusivement en ligne de commandes.
- Sous Windows, lancer le programme "Invite de commandes" ("cmd.exe") à partir du menu depuis le menu démarrer.
- Sous un environnement Unix, un terminal au choix...
Pour lancer les scripts, il suffit de se place dans le répertoire qui les contient, et de lancer ("$" désigne le prompt, on suppose qu'on traite le fichier d'entrée "example.txt" fourni) :
$ python3 allongos_lexico2tmx.py example.txt example.tmx... pour obtenir un fichier d'alignement TMX, et
$ python3 allongos_tmx2html.py example.tmx example.html... pour obtenir l'interface en HTML. Ouvrir cette dernière avec un navigateur Web.
Les deux scripts disposent d'un certain nombre d'options (format Unix), que l'on peut lister en passant l'option "-h" :
$ python3 allongos_lexico2tmx.py -h
$ python3 allongos_tmx2html.py -hEn particulier :
- l'option -t permet de spécifier l'emplacement de
tercom.7.25.jar, s'il ne se trouve pas dans le répertoire courant.
Par exemple s'il est dans le répertoire parent :
$ python3 allongos_lexico2tmx.py -t ../tercom.7.25.jar- l'option -g (pour
allongos_tmx2html.py) permet de produire quatre fichiers Gnuplot :
$ python3 allongos_tmx2html.py -g exampleGraph example.tmx example.html... produira quatre graphes :
exampleGraph_longitudinal_detail.gp
exampleGraph_longitudinal_global.gp
exampleGraph_textual_detail.gp
exampleGraph_textual_global.gp
... donnant un aperçu des opérations de réécriture selon les axes textuel et longitudinal.
$ gnuplot exampleGraph_longitudinal_detail.gp... etc., ce qui produira un fichier d'image (format PNG) pour chacun.
Exemples de sorties
On trouvera sur cette page <http://syled.univ-paris3.fr/projet_anr/ecritures/allongos/alignements-allongos.html> des exemples de sorties produites par Allongos.
Bibliographie