Intervention de Vincent Bénet : "Traitement automatique de corpus avec le logiciel Nooj, environnement linguistique multilingue"

Séminaire
|
Linguistique
|
Mercredi, 23 octobre, 2019 - 16:30 - 18:00
|
Centre d'études franco-russe, 1, rue Nikoloïamskaïa, Moscou

Cet exposé se propose d’examiner comment des ressources linguistiques sont créées et comment elles peuvent être utilisées avec le logiciel Nooj de Max Silberztein.

Nooj est un environnement linguistique multilingue sous licence GNU GPL qui traite des fichiers de texte (ou des corpus) à des niveaux orthographiques, lexicaux, morphologiques, syntaxiques et sémantiques.

Des exemples de possibilités de travail avec le russe et le français seront données pour le traitement de textes et de corpus.

Une comparaison sera faite entre les possibilités de Nooj, de Ruscorpora et de Frantext.

Après un exposé théorique et une démonstration, une partie pratique pourra être initiée avec l’installation de Nooj sur les ordinateurs personnels des étudiants et un exemple de travail avec des textes.

 

La séance se déroulera en français sans traduction.

Retour aux événements