Accueil >> Recherche >> Science Ouverte >> Corpus

Les CORPUS de la Sorbonne Nouvelle

Si vous souhaitez créer un projet pour votre corpus, stocker, valoriser vos données ou avoir des renseignements, vous pouvez contacter le service Valorisation et diffusion de la culture scientifique.

 

TRACS


TRACS : la plateforme numérique d’histoire culturelle transatlantique, éditée en quatre langues, pour analyser les dynamiques de l’espace atlantique et comprendre son rôle dans le processus de mondialisation contemporain





DINLANG




Diners familiaux, Langage & multimodalité


Ce projet rassemble des chercheurs et chercheuses autour du dîner familial français, véritable marqueur du patrimoine culturel, durant lequel parents et enfants sont rassemblés autour de la table. L’objectif du projet est d’analyser comment se transmettent les pratiques langagières en français et en Langue des Signes Française dans les repas familiaux au cours desquels les participants doivent coordonner leurs productions et leurs actions.
DinLang au menu de L'oeil et la main sur France 5

Comment procéder à l'analyse de mon corpus ?

  • Bonnes pratiques : consultez ici un article d'initiation
  • Outils conseillés aux chercheurs : consulter cette page.
  • Formations doctorants et chercheurs : consulter ici le calendrier des prochaines formations proposées par la DiRVED et les formations passées

Contact : pour toute question ou information veuillez contacter Chiara Mainardi


LES CORPUS DISPONIBLES EN LIGNE


Vous trouverez ci-dessous une liste des corpus des unités de recherche relevant de l'université Sorbonne Nouvelle.

BOLAÑO & Company




BOLAÑO & C - Base de données intéractive sur la réception internationale de la littérature latino-américaine

Le projet se concentre sur l’émergence de l’écrivain chilien Roberto Bolaño en tant que romancier à la fin des années 1990 et au début des années 2000.


 

Ciné 08-18



Ciné 08 -18 
Histoire du cinéma en France de 1908 à 1919

Une période charnière entre industrie et création, information et propagande : à la recherche de nouvelles formes d'expression.

 

CFPP2000

 
Discours sur la ville : un ensemble d'interviews sur les quartiers de Paris et de la proche banlieue

 

CLIODIFLE


 
CLIODIFLE - Bibliothèque numérique du projet CollEX-Persée

La première base de données d'archives ouvertes de la didactique du Français langue étrangère et seconde.
 


Visite virtuelle de l'école DFLE, au 46 St Jacques, Sorbonne Nouvelle

 

COLAJE

Une plate-forme contenant une base de données longitudinales d'interactions adultes-enfants pour approfondir les connaissances sur la communication langagière chez le jeune enfants.

COMMON SYLLABI


Le projet Common Syllabi est un projet d'archive et de partage en accès ouvert de syllabus et plans de cours. 

DIFDEPO

 

Le site des archives de l'Oulipo (Ouvroir de Littérature Potentielle) dans une base de données en ligne interrogeable.

 

DINLANG



Diners familiaux, Langage & multimodalité


L’objectif du projet est d’analyser comment se transmettent les pratiques langagières en français et en Langue des Signes Française dans les repas familiaux au cours desquels les participants doivent coordonner leurs productions et leurs actions.
 

ECRISCOL


Projet de recherche soutenu par le Labex EFL, centré sur l’analyse des écrits produits en situation scolaire, qui vise à rassembler, transcrire et annoter de nombreuses copies manuscrites d'élèves du CP à l'Université. Le corpus d'Ecriscol est rassemblé depuis 2022 dans le projet ANR E-CALM
 
 

E-CALM


Ecritures scolaires : Corpus, Analyses, Linguistiques, Modélisations didactiques.
Un grand corpus d’écrits scolaires et universitaires que l’on peut aujourd’hui explorer et analyser. E-CALM est un projet interdisciplinaire s’articule autour des compétences de quatre laboratoires LLE-ERSS (UMR 5263), CIRCEFT-ESCOL (EA 4384).
 

ELLAF

 
La bibliothèque numérique des littératures en langues africaines. Recherche, documentation, édition.

 

ENFLANG



ENFLANG - Le langage de l'enfant

Suivi à long terme du langage d'enfants.
Monologues, Humour, Dîners en famille
 


 

ERHO


Renaissances d'Horace : éditions et traductions humanistes en ligne du poète latin Horace
 



En françaiS au pluriel


Lire le « s » d’en français comme une marque de pluriel.
 

FORMESTH

 
Formalisme esthétique en Europe centrale aux XIXe et XXe siècles. (site bientôt disponible à nouveau)

LANGAS

Une base de donnée sur les langues amérindiennes du XVIe au XIXe siècles (tupi, guarani, quechua et aymara), incluant les sources numérisées et transcrites afin de rendre visibles et questionnables des écrits prestigieux de grandes langues véhiculaires de l’époque coloniale.
 

LIVRE D'IMAGE

 
 
 
 
Pour l’identification et la partition de Le Livre d’image (2018), dernier film de Jean-Luc Godard. 
Outre l’accès libre à la partition du film, ce travail permet aux utilisateurs enregistrés de compléter le travail d’identification, ou de suggérer des modifications (environ 80% des œuvres citées sont pour l’instant identifiées)


 

LITTEPUB

Histoire croisée de la littérature et de la publicité en France

 

LIVRESC



Livres (Espaces) de Création : sélection, parmi les collections de la BLJD, d’ouvrages représentatifs de l’évolution du livre à voir (XIXe - XXIe siècles). (site bientôt disponible à nouveau)



MACINTOSH


MACINTOSH

Le projet MACINTOSH (Missing hAlf the picture: ClassIcal NoT sO claSsical FrencH) est consacré à la constitution et à l’annotation d’un corpus de français de l’époque classique, à partir du témoignage qu’en donne une vaste collection de lettres privées : les « Prize Papers ». Vous pouvez consulter ici l'interface de questionnement du corpus.

 

ORFEO

Outils et Ressources sur le Français Ecrit et Oral. Corpus d'Etude pour le Français Contemporain.
 

Collection PANGLOSS


Archive en ligne de ressources linguistiques dans des langues en danger et sous documentées
 

POLAR




Valorisation critique des archives de Claude Simon

 

PROSIGNE




Interactions spontanées, polyadiques, avec des enfants en Langue des Signes Française 

En famille, Dîners, Methologies et outils


 

Pro-TEXT


Les processus de textualisation: modélisations linguistiques, psycholinguistiques et d'apprentissage automatique
 
 

QUIEN ES QUIEN



 
Une base de donnée pour répertorier visages et attributs divers des principaux acteurs politiques et culturels dans les publications satiriques illustrées de la deuxième moitié du XIXe siècle en Espagne.

TRACS


 


TRACS : la plateforme numérique d’histoire culturelle transatlantique, éditée en quatre langues, pour analyser les dynamiques de l’espace atlantique et comprendre son rôle dans le processus de mondialisation contemporain.


 

mise à jour le 26 novembre 2024


Â