Projet GEODE


Siteweb du projet GEODE

Projet GEODE

Siteweb du projet GEODE

Le projet interdisciplinaire GEODE (2020-2024) financé par le LabEX ASLAN réunit des chercheurs en linguistique, informatique et géographie des laboratoires ICAR, LIRIS et EVS. Ce projet fait suite au projet GéoDISCO (2019-2020) financé par la MSH Lyon St-Etienne. Notre objectif est d’étudier dans un corpus de quatre encyclopédies françaises les changements survenus dans les discours géographiques entre 1750 et nos jours. Pour cela, nous nous aiderons des méthodes de classification semi-supervisée des textes, de génération de modèles de langues et de repérage automatique de routines discursives.

Contexte de l’étude

GEODE est une collaboration interdisciplinaire où les méthodes de linguistique de corpus, d'informatique, de science de l'information géographique et d'histoire des idées convergent autour d'un objectif scientifique déjà partagé par les laboratoires ICAR et LIRIS : les discours géographiques dans les encyclopédies françaises. Qu’il s’agisse de l’Encyclopédie de Diderot, d’Alembert et Jaucourt au XVIIIe s. (1751-1772), de La Grande Encyclopédie au XIX e s. (1886-1902), de l’Encyclopædia Universalis ou de Wikipédia au XXI e s., chacune de ces vastes entreprises intellectuelles et éditoriales a cherché à présenter à ses lecteurs une synthèse des savoirs de son temps, parmi lesquels les savoirs géographiques. C’est à ces derniers que nous nous intéressons.



Cadre Théorique

Dans GÉODE, nous assignons au « discours géographique » deux acceptions. La première vise la structure intraphrastique topic-comment impliquant une relation d’aboutness (Reinhart 1982, Lambrecht 1994, Berthoud 1996). Il s’agit pour nous de construire, en nous fondant sur une approche statistique, une représentation sémantique des propos tenus dans les articles à propos d’entités spatiales évoquées (villes, rivières, montagnes, ...). Pour la seconde acception, de niveau discursif, nous faisons l’hypothèse qu’entre le XVIIIe s. et aujourd’hui s’est mise en place une norme discursive encadrant l’énonciation des informations géographiques, en lien avec le processus d’institutionnalisation de cette discipline (Péaud 2016, Laboulais 2001). Notre objectif est de cerner l’émergence des structures linguistiques caractéristiques de cette norme.


Méthode

Tout d’abord, nous nous concentrerons sur la préparation des corpus (homogénéisation des formats, corrections, annotations) afin que le contenu de chaque encyclopédie puisse être traité automatiquement. Ensuite, notre proposition consistera à développer des algorithmes adaptés pour l'analyse automatique et la recherche d’information géo- sémantiques. Nous nous intéressons en particulier au développement de modèles linguistiques adaptés à l'analyse diachronique du discours géographique dans un corpus de documents textuels publiés entre le XVIIIe et le XXIe siècle. Notre méthodologie est basée sur le développement d'une chaîne de traitement composée de différentes tâches qui nécessitent des ressources spécifiques (documents annotés, modèles linguistiques, ressources géographiques, etc.).


L'équipe






Publications


  • Dans le cadre du projet précédent GéoDISCO (2019-2020)
Moncla, L., Vigier, D., Mcdonough, K., Brenon, A., & Joliveau, T. (to appear).
Combinaison d’approches qualitative et quantitative pour le repérage et la classification des entités nommées dans l’​Encyclopédie​ de Diderot et d’Alembert (1751-1772).
International Symposium of Theoretical linguistics in the light of the interaction of qualitative and quantitative approaches. Neuchâtel, Switzerland.

Vigier, D., Moncla, L., Brenon, A., Mcdonough, K., & Joliveau, T. (2020).
Classification des entités nommées dans l’Encyclopédie ou dictionnaire raisonné des sciences des arts et des métiers par une société de gens de lettres (1751-1772).
7e Congrès Mondial de Linguistique Française (CMLF). Montpellier, France.

Vigier, D., Moncla, L., Joliveau, T., Mcdonough, K., & Brenon, A. (2019).
GeoDISCO: Encyclopedic Geographical Discourse in France from the Enlightenment to Wikipedia.
13th International Workshop on Geographic Information Retrieval (GIR’19). Lyon, France.

Moncla, L., McDonough, K., Vigier, D., Joliveau, T., & Brenon, A. (2019).
Toponym disambiguation in historical documents using network analysis of qualitative relationships.
Proceedings of the 3rd ACM SIGSPATIAL International Workshop on Geospatial Humanities, 1–4. Chicago, IL, USA.

McDonough, K., Moncla, L., & van de Camp, M. (2019).
Named entity recognition goes to old regime France: geographic text analysis for early modern French corpora.
International Journal of Geographical Information Science, 33, 2498–2522.



Ressources





Actualités