ANR - Ecritures >> ANR - Ecritures >> Allongos

Allongos

Alignement longitudinal pour l'étude génétique de brouillons d'écrivains

Logiciel développé par Adrien Lardilleux

Présentation

Allongos produit, à partir d'un fichier texte contenant tous les états d'un texte, séparés par de balises :
 
  • un fichier d'alignement au format TMX ;
  • un fichier de visualisation au format HTML ;
  • éventuellement : 4 fichiers Gnuplot (.gp) permettant d'obtenir 4 graphiques (1 chacun).
Nécessite Python 3 et Java.

Installation

Allongos est écrit en Python 3, et nécessite le programme tercom (présent dans le présent paquetage, ou téléchargeable à l'adresse http://www.cs.umd.edu/~snover/tercom/), lui-même écrit en Java.

Installer Python 3.x en le téléchargeant à partir de cette page : http://www.python.org/download/

Java est installé par défaut sur la plupart des machines, ou téléchargeable ici : http://www.java.com/en/download/

Les installateurs de ces deux logiciels devraient configurer automatiquement les environnements Python et Java (les exécutables "python3" et "java" doivent être dans la variable PATH).

 

Téléchargement

Allongos est disponible dans cette archive [ZIP - 68 Ko].

Contenu de l'archive

  • fwords.txt : liste de mots fonctionnels du français, utilisée par le script allongos_lexico2tmx.py. Un autre fichier peut être passé au script avec l'option -f (par défaut, le script cherche ce fichier dans le répertoire courant).
  • allongos_lexico2mx.py : script Python qui convertit un fichier d'entrée au format Lexico en un fichier au format "pra" (sortie de TER) en fichier d'alignement au format TMX.
  • allongos_tmx2html.py : script Python qui convertir un fichier d'alignement au format TMX en fichier de visualisation au format HTML, et produit en plus les 4 fichiers Gnuplot si l'option -g est passée.
  • tercom.7.25.jar : TER, appelé par allongos_lexico2tmx.py et allongos_tmx2html.py. Un autre jar peut être passé au script avec l'option -t (par défaut, le script cherche ce fichier dans le répertoire courant).
  • example.txt, et autres example.* : Exemple de fichier d'entrée, et fichiers de sortie correspondants.

Utilisation

 Allongos s'utilise exclusivement en ligne de commandes.

  • Sous Windows, lancer le programme "Invite de commandes" ("cmd.exe") à partir du menu depuis le menu démarrer.
  • Sous un environnement Unix, un terminal au choix...

Si Python et Java sont correctement installés, on doit pouvoir lancer les commandes "python3" et "java" directement. Si elles ne marchent pas, voir ces pages :
http://docs.python.org/3/tutorial/interpreter.html#invoking-the-interpreter (juste la première section)
http://www.java.com/en/download/help/path.xml


Pour lancer les scripts, il suffit de se place dans le répertoire qui les contient, et de lancer ("$" désigne le prompt, on suppose qu'on traite le fichier d'entrée "example.txt" fourni) :

$ python3 allongos_lexico2tmx.py example.txt example.tmx
... pour obtenir un fichier d'alignement TMX, et

$ python3 allongos_tmx2html.py example.tmx example.html
... pour obtenir l'interface en HTML. Ouvrir cette dernière avec un navigateur Web.


Les deux scripts disposent d'un certain nombre d'options (format Unix), que l'on peut lister en passant l'option "-h" :

$ python3 allongos_lexico2tmx.py -h
$ python3 allongos_tmx2html.py -h


En particulier :

- l'option -t permet de spécifier l'emplacement de tercom.7.25.jar, s'il ne se trouve pas dans le répertoire courant.

Par exemple s'il est dans le répertoire parent :

$ python3 allongos_lexico2tmx.py -t ../tercom.7.25.jar

- l'option -g (pour allongos_tmx2html.py) permet de produire quatre fichiers Gnuplot :

$ python3 allongos_tmx2html.py -g exampleGraph example.tmx example.html

... produira quatre graphes :

exampleGraph_longitudinal_detail.gp
exampleGraph_longitudinal_global.gp
exampleGraph_textual_detail.gp
exampleGraph_textual_global.gp

... donnant un aperçu des opérations de réécriture selon les axes textuel et longitudinal.

Pour les tracer, il faut installer Gnuplot (http://www.gnuplot.info/), et lancer pour chacun la commande :

$ gnuplot exampleGraph_longitudinal_detail.gp
... etc., ce qui produira un fichier d'image (format PNG) pour chacun.

Exemples de sorties

On trouvera sur cette page <http://syled.univ-paris3.fr/projet_anr/ecritures/allongos/alignements-allongos.html> des exemples de sorties produites par Allongos.

Bibliographie


mise à jour le 16 juin 2013


Â