Accueil >> Formations >> S'informer sur nos formations

Sciences du Langage

Master 1
Ingénierie Linguistique
Traitement Automatique des langues


Nature :
Formation diplômante
Durée des études :
2 ans

Accessible en :

Formation initiale
Formation continue
+ d'infos

Actualités :

Journée d'accueil du Master Ingénierie Linguistique le vendredi 30 septembre 2011 à 14h, Inalco, 49bis, avenue de la Belle Gabrielle, 75012 PARIS (RER A, direction Boissy Saint Léger, arrêt à Nogent sur Marne, sortie Marronniers, puis 5 minutes de marche, ou METRO : Château de Vincennes, puis bus 112.)

Rentrée 2011-2012

Début des cours du Master Ingénierie Linguistique :

les cours de Paris Ouest démarrent le lundi 03/10/2011,
les cours de Paris 3 démarrent le lundi 03/10/2011,
les cours de l'Inalco démarrent le lundi 03/10/2011.

Le planning du parcours R&D 2011/2012 est dans la brochure.

Pour toute information contacter : serge.fleury@univ-paris3.fr



Le master Ingénierie Linguistique est proposé en co-habilitation avec l'université Paris X et INALCO.


URL du Master :
http://pluriTAL.org

Brochure en ligne sur le site pluriTAL




Le Master fait appel à des méthodes et des savoirs multiples :

  • En matière linguistique, maîtriser les manipulations débouchant sur des descriptions détaillées de faits de langue, connaître les bases des grands domaines des sciences du langage (phonétique et phonologie, morphologie, syntaxe et sémantique) ;

  • Connaître les bases de la recherche et de l'extraction d'information, de la constitution et de la gestion de corpus de ressources, y compris multilingues : les corpus sont des mines d'information pour une description réalistes d'emploi d'une langue, les techniques de la recherche et de l'extraction d'information permettent de rapatrier les documents ou les parties des documents jugés pertinents pour un besoin de recherche particulier ;

  • Exprimer les règles et les régularités à l'œuvre dans les corpus, par le biais des grammaires formelles et des traitements quantitatifs pour savoir passer d'une description linguistique d'un texte à une représentation plus formelle permettant sa prise en charge par des logiciels.


Pour la rentrée 2009/2010, le Master aura pour seule spécialité : Ingénierie Linguistique

La spécialité « Ingénierie linguistique »

La spécialité Ingénierie linguistique concerne la recherche et le développement dans le domaine du TAL et des industries de la langue.

L'ingénierie linguistique fait appel à des méthodes et à des savoirs multiples. Il s'agit de :

1.      Disposer des pré-requis en linguistique : maîtriser les manipulations débouchant sur des descriptions détaillées de faits de langue, connaître les bases des différents domaines des sciences du langage (phonétique et phonologie, morphologie, syntaxe et sémantique) ;

2.      Connaître les bases de la recherche et de l'extraction d'information, de la constitution et de la gestion de corpus (écrits ou oraux) et de ressources, y compris multilingues : les corpus sont des mines d'information pour une description réaliste d'emplois d'une langue, les techniques de la recherche et de l'extraction d'information permettent de rapatrier les documents ou les parties de documents jugés pertinents pour un besoin particulier ;

3.      Exprimer les règles et les régularités à l'œuvre, par le biais des grammaires formelles et des traitements quantitatifs pour savoir passer d'une description linguistique à une représentation plus précise permettant son utilisation par des logiciels.

L'objectif de la formation est de donner à des étudiants issus de cursus de langues ou de sciences du langage des bases solides qui leur permettent de s'orienter vers les métiers de l'ingénierie linguistique, et de leur donner les possibilités de choisir entre diverses perspectives : document électronique, ingénierie multilingue, traductique. Il s'agit aussi de permettre à certains d'entre eux d'opter pour la recherche et le développement en ce domaine.


Objectifs

 Objectifs d'apprentissage de la spécialité en termes de connaissances (connaissances disciplinaires, connaissances pluridisciplinaires sur l'objet étudié, connaissances méthodologiques, connaissances linguistiques, ...)

  • Savoirs disciplinaires en linguistique (en complément de bases solides en phonétique/phonologie, morphologie, syntaxe et sémantique) : sémantique formelle, sémantique lexicale, systèmes d'écriture, traductologie, traductique ;
  • Savoirs en TAL : grammaires formelles, syntaxe formelle, analyse syntaxique automatique, gestion du multilinguisme, statistique et analyse multidimensionnelle, traitement de l'oral, recherche et extraction d'information, corpus alignés ;
  • Savoirs en informatique : programmation et algorithmique spécifique, bases de données, document structuré (XML) ;
  • Maîtrise en réception puis en production de l'anglais scientifique.

 

Objectifs d'apprentissage de la spécialité en termes de compétences

Savoir s'intégrer dans un projet collectif multi-disciplinaire :

  • comprendre sa contribution spécifique dans le projet ;
  • transmettre de manière claire son apport (outils de formalisation) ;
  • assurer les coordinations nécessaires.

Objectifs d'apprentissage de la spécialité en termes de compétences métier

  • Technologies et méthodes de conception et développement : bases de données relationnelles, normes et outils pour documents structurés, conception de produits informationnels ;
  • Connaissances des produits et outils industriels en gestion d'information et en traitement des documents.
  • Capacité de maîtriser la gestion de projets
  • Traitement du document numérique

Spécificités

La spécialité s'organise selon quatre parcours, adossés chacun à un (ou plusieurs établissements universitaires) :

  • le parcours DEFI (Documents Electroniques et Flux d'Informations), basé à Paris Ouest Nanterre La Défense, qui prend la suite de la spécialité DEFI du master mention Sciences du langage (URL du parcours DEFI : http://www.u-paris10.fr/defi/);
  • le parcours Ingénierie multilingue, basé à l'INALCO ;
  • le parcours Traductique, également basé à l'INALCO ;
  • le parcours Recherche et Développement, basé dans les trois établissements

Et après ?

Poursuites d'études
  • 2ème année de Master spécialité Ingénierie Linguistique

La spécialité s'organise selon quatre parcours, adossés chacun à un (ou plusieurs établissements universitaires) (voir plus haut). Quatre parcours sont donc possibles en seconde année du master :

Le parcours DEFI et le parcours Recherche et développement ont en commun au premier semestre l'UE « Ingénierie des textes et des documents ». Ils se distinguent par les UE : « Documentation et flux d'informations » et « Informatique et traitement de l'information » en DEFI, « Ingénierie linguistique et TAL » et « Linguistique » en Recherche et développement. Le deuxième semestre est entièrement différencié, puisque dans le parcours Recherche et développement il y a obligatoirement un mémoire, et que l'UE « Préparation à l'insertion professionnelle » est remplacée par de la méthodologie de la recherche.

Enfin, les parcours Ingénierie multilingue et Traductique se distinguent en deuxième année par des enseignements de « Techniques de traduction » pour ce dernier parcours, ce qui a pour répercussion que les UE « Linguistique », « Modèles et formalismes », « Informatique » et « Ingénierie » ont un moindre poids dans ce parcours.

Débouchés professionnels
  • Métiers auxquels la spécialité permet d'accéder directement : Ingénieur linguiste, terminologue, gestionnaire de site web multilingue, lexicologue, chef de projet multimédia, traducteur

  • Préparation aux formations de recherche dans le domaine du TAL et en ingénierie multilingue.
Niveau(x) de recrutement :
Bac + 3

Conditions d'admission

L' étudiant devra être titulaire d'une licence dans l'une des  mentions ou spécialités suivantes : « Sciences du Langage » ; « Lettres » ; « Langues, littératures et civilisations étrangères » ;  « Sciences humaines et sociales » ; « Psychologie » ; « Mathématiques appliquées aux sciences sociales » ou d'une bi-licence ou encore d'une licence inter-mentions ayant une composante de Sciences du langage  (ex. « Sciences du langage, civilisation européenne : langue » ; « Lettres/sciences du langage »)

L'admission en 2ème année se fait sur dossier y compris pour les étudiants reçus en master 1. Les étudiants titulaires d'un master de Sciences du langage ou de LLCE pouvant faire état d'une appétence pour l'informatique, ou les étudiants en informatique ayant manifesté de l'intérêt pour les langues ou la linguistique verront notamment leur dossier examiné avec intérêt.

Les commissions qui statueront les admissions sont distinctes selon les parcours. Les étudiants peuvent ainsi déposer plusieurs dossiers de demande d'admission. Pour le parcours Recherche et Développement, il est demandé aux étudiants d'obtenir l'accord d'un directeur de recherche qui supervisera leur mémoire.

Formation continue

Le master est aussi ouvert en formation continue pour  les traducteurs, documentalistes, bibliothécaires, gestionnaires de sites Web, employés du tertiaire soucieux de se former à des technologies innovantes détenteurs d'une licence ou d'un équivalent par validations d'acquis.

Organisation générale des études


Brochure en ligne sur le site pluriTAL

____________________________________________

Master spécialité Ingénierie Linguistique 2009-2013

Contenu des unités d'enseignement 

 UE de M1 S1 :

TAL et ingénierie linguistique 1        Cette UE donne un aperçu d'un certain nombre d'outils et de méthodes du traitement automatique des langues. Sont étudiées les Grammaires formelles (ou les langages réguliers), l'analyse syntaxique automatique, Informatique et phonétique, la gestion informatique du multilinguisme. La réalisation d'un projet est amorcée.

Linguistique 1          Cette UE a pour objectif d'accroître les connaissances en linguistique générale des étudiants. En dehors d'un enseignement sur la génération automatique de textes, ils pourront prendre à leur choix 6 crédits de linguistique.

                                      

Document numérique et Informatique 1     Il s'agit, outre la familiarisation avec la notion de bases de données, le début d'un apprentissage systématique et raisonné de la programmation.

                                              

UE de M1 S2 :

TAL et ingénierie linguistique 2      On continue d'appréhender les outils et méthodes du traitement automatique des langues, notamment les méthodes statistique, le traitement de corpus, la syntaxe formelle (ou des compléments sur les langages réguliers). Le projet commencé au semestre 1 est achevé.

Linguistique 2                Les étudiants poursuivent le perfectionnement de leur culture en linguistique générale, en suivant un enseignement de syntaxe formelle à quoi s'ajoutent trois crédits à prendre au choix.                                      

Document numérique et Informatique 2       Outre la poursuite de l'apprentissage de la programmation, les étudiants se familiarisent avec les techniques de Recherche et extraction d'information et de traitement des documents structurés.

UE de M2 DEFI :

Documentation et flux d'informations  On étudie les fondements sur la structuration et la nature de l'information, et il est développé ce que sont la veille et l'intelligence économique

Informatique et traitement de l'information  Les connaissances en programmation sont prolongées par un apprentissage de la programmation orientée objet, par la manipulation des chaînes de traitement sous Unix. Les connaissances en bases de données sont prolongées par la connaissance de la mise en place de sites Web dynamiques. Enfin toute la chaîne de la gestion de l'information électronique est présentée.                             

Préparation à l'insertion professionnelle  On explique comment sont industrialisés les processus, notamment en ingénierie linguistique. De même est présentée la gestion des projets, et des conférences sont données par des professionnels.

Projet de fin d'études  Par groupes de 4 à 6 étudiants est réalisé un projet qui nécessite une étude de la tâche à accomplir, la définition d'un cahier des charges, la répartition du travail, et qui fait appel à un certain nombre des connaissances techniques acquises dans les autres UE du master.

Stage en entreprise  L'étudiant s'intègre réellement dans une entreprise, et il présente son expérience dans un rapport de stage soutenu oralement.

UE de M2 DEFI et R&D :

Ingénierie des textes et des documents  On étudie et manipule un certain nombre de logiciels de traitement automatique de la langue et notamment des outils statistiques. On se perfectionne dans le traitement des expressions régulières, et on va aussi loin que possible dans l'appréhension des outils de traitement des documents structurés.

UE de M2 R&D :

Ingénierie en TAL  Il s'agit, pour les étudiants, de se familiariser avec la démarche de recherche en traitement automatique des langues et/ou en linguistique formelle, à travers l'étude systématique de quelques problèmes bien définis et d'approches bien identifiées.

Linguistique  L'objectif est d'approfondir la culture en linguistique des étudiants, en les mettant au fait d'un certain nombre de recherches actuelles dans le domaine.

Méthodologie de la recherche  L'étudiant, à travers notamment une réflexion sur son propre travail d'élaboration d'un mémoire et celui des autres étudiants, progresse dans ses capacités à faire de la recherche dans le domaine.

Stage en laboratoire ou en entreprise  Étude d'un problème dans un contexte de coopération.

Mémoire  Rédaction d'un mémoire de recherche soutenu oralement devant un jury.

UE de M2 Ingénierie multilingue (INALCO):

Linguistique (I)              Sémantique des textes multilingues

                                       Lexicologie, terminologie, dictionnairique

                                       Genres, textes et usages

Modèles et formalismes (I)    Documents structurés

                                       Calculabilité

                                       Acquisition et modélisation des connaissances

Informatique (I)             programmation objet 1

                                       Langages de script                                    

Ingénierie (I)                  Multimodalité du document numérique 1

                                       Analyse du discours et lexicométrie

                                       Outils de TAO 1

                                       Outils de traitement de corpus

                                       Traitement statistique de corpus

                                       Ecritures et multilinguisme

Linguistique (I)              Sémantique des textes multilingues 2

                                       Lexicologie, terminologie, dictionnairique

Modèles et formalismes (I)    Indexation et gestion électronique de documents

Informatique (I)             Analyse robuste

                                       Programmation itérative et récursive

                                       Programmation objet 2

                                       Bases de données sur le web

Ingénierie (I)                  techniques web

                                       Outils de TAO 2

UE de M2 Traductique (INALCO):

Linguistique (T)             Sémantique des textes multilingues 1

                                       Lexicologie, terminologie, dictionnairique 1

                                       Genres, textes et usages

Modèles et formalismes (T)   document structurés

                                       Acquisition et modélisation des connaissances

Traduction technique (T)       Traductologie 1

                                       Conduite de projets de traduction 1

Informatique (T)            Bases de données pour le web

                                       programmation shell

Ingénierie (T)                 Multimodalité du document numérique

                                       Outils de TAO 1

                                       Traitement statistique de corpus

                                       Ecritures et multilinguisme

Linguistique (T)             Sémantique des textes multilingues 2

                                       Lexicologie, terminologie, dictionnairique 2

Modèles et formalismes (T)   Indexation et gestion électronique de documents

Traduction technique (T)       Traduction technique 2

                                       Traductologie 2

                                       Conduite de projets de traduction 2

Ingénierie (T)                 techniques web

                                       outils de TAO 2

Tableau synthétique des UE du Master 1 et 2 :



(ce lien donne accès au tableau précédent)

Parcours en M1






Recherche et développement (P3, PX, Inalco)

DEFI (PX)

Traductique (Inalco)

Ingénierie multilingue (Inalco)

Laboratoires partenaires

Un partenariat universitaire pour le TAL (pluriTAL)

La formation s'appuie sur les laboratoires :

Etablissements partenaires

Le diplôme est délivré par les 3 partenaires suivants :

  • Université Paris Ouest Nanterre La Défense
  • Université Paris 3 Sorbonne nouvelle
  • Institut National des Langues et Civilisations Orientales (INALCO)

Responsable(s)

  • UFR Institut de Linguistique et Phonétique Générales et Appliquées
    19, rue des Bernardins - 75005 Paris
    Tél. 01 44 32 05 70
    Fax 01 44 32 05 73
    Courriel
    Site web : http://pluriTAL.org

mise à jour le 4 juillet 2011


Renseignements

Département : Institut de Linguistique et Phonétique Générales et Appliquées (ILPGA)
19, rue des Bernardins
75005 PARIS

Tél. : +33 (0)1 44 32 05 70 standard
Fax : +33 (0)1 44 32 05 73
Mél.

MASTER  spécialité  Ingénierie Linguistique

Université Paris Ouest Nanterre La Défense,  Université Paris 3 Sorbonne nouvelle, INALCO

La spécialité Ingénierie linguistique concerne la recherche et le développement dans le domaine du TAL et des industries de la langue.

Recherche d'une formation

Recherche d'une formation