Axe 5 : Structuration et exploitation de corpus

Coordinateurs

Mohamed Morchid (LIA, Informatique) et Graham Ranger  (ICTT, Linguistique)

 

Mots-clés

Structuration et Exploitation de l’information, Extraction de descripteurs, Modélisation, Corpus, Base de données, Apprentissage automatique, Intelligence artificielle.

 

Objectifs de l’axe 5

L’objectif premier de l’axe 5 est de penser des modèles et méthodologies innovants de structuration et d’exploitation de l’information. Ces méthodologies seront fondées sur des paradigmes théoriques de modélisation et d’extraction de descripteurs de haut-niveaux pour le volet “structuration”, ainsi que sur des procédés et processus de recherche d’information (RI) pour les parties extraction et valorisation des contenus. Ces nouvelles méthodologies seront évaluées lors d’expérimentations de traitement de l’information portant sur des corpus de données interdisciplinaires ainsi que sur des tâches dédiées.  Elles seront étroitement liées au domaine de l’apprentissage automatique.

Les chercheurs d’Agorantic travaillent sur des données dont les quantités et les structures internes sont de nature très variables et spécifiques aux disciplines dont elles sont issues. L’axe 5  a vocation à soutenir le projet de la FR de partage de corpus  et de contribuer à la mise en place de traitements conjoints de ces corpus à partir d’outils existants (accès distant sur d’autres plateformes) ou  d’outils développés au sein de la FR et partagés sur l’espace collaboratif.

En complément l’axe 5 entend promouvoir les échanges entre les chercheurs des différents axes et avec des chercheurs des unités de recherche associés, en organisant des rencontres (séminaires, workshops, etc.) autour de la problématique de la gestion commune de l’information.

 

Objets d’étude

  • Des modèles théoriques et des méthodologies innovantes, adaptés aux problématiques  portées par la FR
  • L’accompagnement des chercheurs de la FR  dans la préparation de leurs corpus de données en vue de leur interrogation, leur modélisation et leur exploitation, via une interface mutualisée et mutualisable en ligne
  • Le potentiel (très prometteur) des représentations et systèmes fondés sur les réseaux de neurones profonds
  • L’interdisciplinarité au service de la gestion des corpus de données

 

Projets liés à cet axe