lundi 18 janvier 2016



Des ressources informatisées pour les langues régionales
Amalia Todirascu, Delphine Bernhard, Lucie Steiblé et Pascale Erhart.
Préserver et diffuser les langues régionales, c’est toute l’ambition du programme de recherche pluridisciplinaire Restaure. Si l’un des objectifs est la constitution de lexiques pour l’alsacien, le picard et l’occitan, le défi est aussi dans le développement d’outils de traitement automatique du langage.
Restaure (Ressources informatisées et traitement automatique pour les langues régionales) est né d’un constat simple : « Si certaines langues régionales sont encore bien parlées, la plupart souffrent d’un manque de ressources et d’outils numériques », explique Delphine Bernhard, enseignant-chercheur au Département informatique de la Faculté des langues et sciences humaines appliquées (LSHA) et responsable scientifique du projet. Les autres participants du projet à l’Université de Strasbourg sont Pascale Erhart, Christophe Gérard, Dominique Huck, Lucie Steiblé et Amalia Todirascu. Tous sont membres du laboratoire Lilpa – Linguistique, langues, parole (EA 1339).

"S Ziel isch mitzehelfe, s regionàle Kulturerwe ze bschüetze un ze verbreite" 
 La tòca mager es d’ajudar a aparar e a difusir lo patrimòni cultural (occitan).
 A l'fin des fins, ch'qu'os espèrons, ch'est de définde et pi d'épars ch'patrimoine ède nos tchultures (picard).
 
Grâce à l’association de plusieurs équipes de recherches de différentes universités, le travail démarre en 2015 avec l’obtention d’un financement de l’Agence nationale de la recherche (ANR). Il se concentre aujourd’hui sur l’alsacien (Unistra), le picard (Université d’Amiens) et l’occitan (Université Toulouse 2). « Pour construire des lexiques et corpus informatisés les plus complets possibles pour chacune de ces langues, les différentes équipes de recherche se basent sur des documents écrits existants. Les données ainsi numérisées serviront autant à l’enseignement des langues, côté apprenants comme côté enseignants, qu’à des recherches en linguistique, par exemple pour étudier l’évolution des langues », commente Delphine Bernhard. 

Au croisement de l’informatique, de la linguistique, de la dialectologie et de la sociolinguistique
Pour réussir à constituer ces lexiques, point de scribe mais bien le développement d’un programme informatique capable de reconnaître les mots et de les intégrer à une base de données. Et c’est bien là que le défi informatique réside. « L’alsacien, par exemple, possède de nombreuses variations à l’écrit. Un même mot peut avoir une dizaine de variantes pour la même signification. Le mot lundi par exemple, pourra trouver des formes aussi diverses que Mondàà, Mantig, Mandig, Mondoe, Mondàj, Maandi, Mandi. Notre volonté est donc de développer un programme capable de reconnaître et de traiter cette variation », explique Delphine Bernhard. Un traitement bien pluridisciplinaire qui croise l’informatique, la linguistique, la dialectologie et la sociolinguistique. 

Avec ce travail de recherche, c’est d’abord la préservation des langues régionales qui est visée mais les méthodes développées pourraient également avoir des applications pour la langue française actuelle. « Les nouvelles formes de communication que nous utilisons aujourd’hui sont elles aussi génératrices de variation pour un même mot », ajoute Delphine Bernhard.  Une langue française qui se code et se décode au jour le jour sur nos différents appareils de communication.
Frédéric Zinck


 Le projet Restaure associe l’Université de Strasbourg (Linguistique, langues, parole (Lilpa), l’Université Toulouse 2 (Cognition langues langage ergonomie – Équipe de recherche en syntaxe et sémantique (CLLE-ERSS), l’Université de Picardie-Amiens (Laboratoire linguistique et sociolinguistique : contacts, lexique, appropriations, politiques (Lesclap) - Centre d’études sur les relations et contacts linguistiques et littéraires (CERCLL - EA 4283) et le CNRS (Laboratoire d'informatique pour la mécanique et les sciences de l'ingénieur-Limsi).

Source : L’ACTU 11 décembre 2015. Journal électronique interne de l’Université de Strasbourg

Aucun commentaire:

Enregistrer un commentaire