Coordinateurs
Mohamed Morchid (LIA, Informatique) et Graham Ranger (ICTT, Linguistique)
Mots-clés
Structuration et Exploitation de l’information, Extraction de descripteurs, Modélisation, Corpus, Base de données, Apprentissage automatique, Intelligence artificielle.
Objectifs de l’axe 5
L’objectif premier de l’axe 5 est de penser des modèles et méthodologies innovants de structuration et d’exploitation de l’information. Ces méthodologies seront fondées sur des paradigmes théoriques de modélisation et d’extraction de descripteurs de haut-niveaux pour le volet “structuration”, ainsi que sur des procédés et processus de recherche d’information (RI) pour les parties extraction et valorisation des contenus. Ces nouvelles méthodologies seront évaluées lors d’expérimentations de traitement de l’information portant sur des corpus de données interdisciplinaires ainsi que sur des tâches dédiées. Elles seront étroitement liées au domaine de l’apprentissage automatique.
Les chercheurs d’Agorantic travaillent sur des données dont les quantités et les structures internes sont de nature très variables et spécifiques aux disciplines dont elles sont issues. L’axe 5 a vocation à soutenir le projet de la FR de partage de corpus et de contribuer à la mise en place de traitements conjoints de ces corpus à partir d’outils existants (accès distant sur d’autres plateformes) ou d’outils développés au sein de la FR et partagés sur l’espace collaboratif.
En complément l’axe 5 entend promouvoir les échanges entre les chercheurs des différents axes et avec des chercheurs des unités de recherche associés, en organisant des rencontres (séminaires, workshops, etc.) autour de la problématique de la gestion commune de l’information.
Objets d’étude
- Des modèles théoriques et des méthodologies innovantes, adaptés aux problématiques portées par la FR
- L’accompagnement des chercheurs de la FR dans la préparation de leurs corpus de données en vue de leur interrogation, leur modélisation et leur exploitation, via une interface mutualisée et mutualisable en ligne
- Le potentiel (très prometteur) des représentations et systèmes fondés sur les réseaux de neurones profonds
- L’interdisciplinarité au service de la gestion des corpus de données
- [Projets 2024] NAHUA – Juan Manuel Torres Moreno (LIA)📜 Titre : NAHUA – Modélisation et création d’un corpus pour le résumé de documents textuels en nahuatl (langue mexicaine autochtone) avec des algorithmes d’Intelligence Artificielle 🧑🤝🧑 Équipe : Juan Manuel TORRES MORENO (LIA) – Porteur Graham RANGER (ICTT) Martha Lorena AVENDANO GARRIDO (Univ Veracruz) Miguel FIGUEROA-SAAVEDRA RUIZ (Univ Veracruz) 📌 Résumé : Nous cherchons…
Lire la suite - [Projets 2024] JIT – Cyrielle Garson (ICTT)📜 Titre : JIT – Journée d’informatique Théâtrale 🧑🤝🧑 Équipe : Cyrielle GARSON (ICTT) – Porteuse 📌 Résumé : Les Journées d’informatique théâtrale (JIT) s’inscrivent dans la continuité d’autres travaux soutenus par la FR Agorantic, notamment le projet « THEAVR_CB21 » et le séminaire « CCVR » qui ont posé les bases d’un dialogue propice…
Lire la suite - [Projets 2024] e-CaM – Olivier Brisville-Fertin (CIHAM) & Matthias Gille Levenson (École nationale des Chartes)📜 Titre : e-CaM – Étiquetage lexico-grammatical du castillan médiéval 🧑🤝🧑 Équipe : Olivier BRISVILLE-FERTIN (ENS Lyon / CIHAM) – Porteur Matthias GILLE LEVENSON (École nationale des Chartes-PSL) 📌 Résumé : Le projet e-CaM (« Étiquetage lexico-grammatical du castillan médiéval ») propose d’améliorer la qualité de l’annotation – lemmes, parties du discours et morphologie –…
Lire la suite - [Projets 2024] OCDELRHÔNE – Stéphane Durand (CNE) & Frédéric Guibal (IMBE)📜 Titre : OCDELRHÔNE – Occupation historique du delta du Rhône (XVIe-XVIIIe siècles) 🧑🤝🧑 Équipe : Stéphane DURAND (CNE) – Porteur Frédéric GUIBAL (IMBE) – Porteur 📌 Résumé : Le delta du Rhône est un espace géomorphologique qui se caractérise par une progradation rapide et des modifications importantes du cours du fleuve à l’échelle historique.…
Lire la suite - [Données] BRÉF : Base Révisée des Élu·e·s de FranceLa Base Révisée des Élu·e·s de France (BRÉF) est une base de données élaborée au cours de la thèse Agorantic de Noémie Févrat. Elle repose sur une source principale, le Répertoire National des Élus (RNE) et sur plusieurs sources secondaires, les bases de données de l’Assemblée Nationale, du Sénat et du Parlement Européen. La base…
Lire la suite - [Projets 2023] SEM – Paola Ranzini (ICTT)📜 Titre : SEM – Archives numériques Omeka (SEM) : Ligne de temps et visualisation 🧑🤝🧑 Équipe : Paola RANZINI (ICTT) – Porteuse Richard WALTHER (Thalim) 📌 Résumé : Dans le cadre de mon projet de recherche SEM (Scènes Européennes Marivaux) je construis des Archives numériques consacrées à rassembler les données et les documents ‘éditorialisés’…
Lire la suite - [Projets 2023] BORIS – Pierre-Henri Morand (LBNC) & Vincent Labatut (LIA)📜 Titre : BORIS – Beneficial Ownership Register Interconnection Scheme 🧑🤝🧑 Équipe : Pierre-Henri MORAND (LBNC) – Porteur Vincent LABATUT (LIA) – Porteur Lucas POTIN (LIA) Téa TOUTOUNJI (CRED) 📌 Résumé : Le projet BORIS vise à récupérer, structurer et exploiter des données du registre français des bénéficiaires effectifs par croisement avec les bases BRÉF…
Lire la suite - [Projets 2023] APFDLI – Delphine Blanke (LMA)📜 Titre : APFDLI – Atelier de présentation/formation autour des données libres de l’Insee 🧑🤝🧑 Équipe : Delphine BLANKE (LMA) – Porteuse 📌 Résumé : La plupart des données de l’Insee, y compris des données individuelles, sont accessibles sur le site de l’organisme, mais peuvent s’avérer difficilement accessibles. Deux ou trois collègues de l’Insee Marseille…
Lire la suite - [Projets 2023] ETEC – Laurent Lombard (ICTT)📜 Titre : ETEC – Éthique(s) et traduction à l’ère contemporaine 🧑🤝🧑 Équipe : Laurent LOMBARD (ICTT) – Porteur Graham RANGER (ICTT) Agnès MAFFRE-BAUGÉ (·JPEG) 📌 Résumé : De nos jours, la traduction est devenue un enjeu majeur de réflexions culturelles, linguistiques, politiques et économiques et s’est imposée comme objet d’étude interdisciplinaire. Le spectaculaire phénomène…
Lire la suite - [Projets 2023] WIKIPOL – Jeanne Vermeirsche (·JPEG) & Victor Plancge (·JPEG)📜 Titre : WIKIPOL – Wikipédia et (les) politique(s) : Acteurs, pratiques et discours 🧑🤝🧑 Équipe : Jeanne VERMEIRSCHE (·JPEG) – Porteuse Victor PLANCHE (·JPEG) – Porteur 📌 Résumé : La question de l’investissement politique sur Wikipédia est travaillée depuis maintenant plusieurs années par l’équipe pluridisciplinaire WikiPol, qui rassemble au sein de l’Université d’Avignon des…
Lire la suite - [Projets 2023] HistoGraPhe – Vincent Labatut (LIA) & Guido Castelnuovo (CIHAM)📜 Titre : HistoGraPhe – Histoire et Graphes de Confronts pour l’Exploitation de la documentation foncière 🧑🤝🧑 Équipe : Vincent LABATUT (LIA) – Porteur Guido CASTELNUOVO (CIHAM) – Porteur Margot FERRAND (CIHAM) 📌 Résumé : Le projet HistoGraPhe vise à exploiter les livres fonciers médiévaux en utilisant la théorie des graphes pour résoudre les problèmes…
Lire la suite - [Projets 2023] HistEurope – Mounir Redjimi (Espace) & Boris Deschanel (CNE)📜 Titre : HistEurope – Base de données géo-historiques des territoires en Europe (1800 2000) 🧑🤝🧑 Équipe : Mounir REDJIMI (Espace) – Porteur Boris DESCHANEL (CNE) – Porteur 📌 Résumé : L’équipe du projet HistEurope sollicite le financement de 2 mois d’ingénierie de recherche pour la mise en forme d’une base de données Spatio-temporelles et…
Lire la suite - [Projets 2023] TRUST – Anna Melnykova (LMA), Rachid Elazouzi & Pierre-Henri Morrand (LBNC)📜 Titre : TRUST – apprenTissage fédéRé poUr deS données héTérogènes et sensibles 🧑🤝🧑 Équipe : Anna MELNYKOVA (LMA) – Porteuse Rachid ELAZOUZI (LIA) – Porteur Pierre-Henri MORAND (LBNC) – Porteur 📌 Résumé : L’objectif du projet est de traiter une problématique majeure liée aux données utilisées par l’intelligence artificielle. La projet propose d’utiliser l’apprentissage…
Lire la suite - [Projets 2023] BASELEC – Jessica Sainty (LBNC)📜 Titre : BASELEC – Base de Données Électorales 🧑🤝🧑 Équipe : Jessica SAINTY (LBNC) – Porteuse Christèle LAGIER (LBNC) Jean RIVIÈRE (UMR ESO 6590 / Univ Nantes) 📌 Résumé : L’équipe du projet BASELEC sollicite le financement de 2 mois d’ingénierie de recherche pour la mise en forme de bases de données politiques, démographiques,…
Lire la suite - [Projets 2022] STYL – Juan Manuel Torres Moreno (LIA)📜 Titre : STYL – La variété stylistique en français et espagnol (corpus littéraires, analyses linguistiques automatisées et évaluation) : suite du projet 🧑🤝🧑 Équipe : Juan Manuel TORRES MORENO (LIA) – Porteur Luis-Gil MORENO-JIMÉNEZ (LIA) Cyrielle GARSON (ICTT) Graham RANGER (ICTT) Madelena GONZALEZ (ICTT) 📌 Résumé : L’objectif de ce projet concerne la génération…
Lire la suite - [Projets 2021] MITO – Guilhem BOULAY (Espace)📜 Titre : MITO – Le mythe d’un marché immobilier Transparent grâce à l’Open Data 🧑🤝🧑 Équipe : Guilhem BOULAY (Espace) – Porteur Laure CASANOVA ENAULT (Espace) Didier JOSSELIN (Espace) Pierre LE BRUN (Espace) Delphine BLANKE (LMA) Richard DUFOUR (LIA) 📌 Résumé : Début 2019, la DGFiP (Ministère de l’Economie, des Finances et de la…
Lire la suite - [Projets 2021] Variété stylistique – Juan Manuel TORRES MORENO (LIA)📜 Titre : Variété Stylistique – En français et en espagnol, corpus littéraires, analyses linguistiques automatisées et évaluation” 🧑🤝🧑 Équipe : Juan Manuel TORRES MORENO (LIA) – Porteur Luis-Gil MORENO-JIMÉNEZ (LIA) Cyrielle GARSON (ICTT) Graham RANGER (ICTT) Madelena GONZALEZ (ICTT) 📌 Résumé : L’objectif de ce projet concerne la génération et la gestion de ressources…
Lire la suite - [Projets 2020] 57e colloque de l’ASRDLF – Cyrille Genre-Grandpierre (Espace)📜 Titre : 57e colloque de l’ASRDLF – Territoire(s) et numérique, Innovations, mutations et décision 🧑🤝🧑 Équipe : Cyrille GENRE-GRANDPIERRE (Espace) – Porteur Didier JOSSELIN (Espace) 📌 Résumé : Chaque jour le numérique impacte un peu plus notre façon de vivre, de travailler, de comprendre et gouverner les territoires. Des habitudes professionnelles aux comportements individuels,…
Lire la suite - [Projets 2020] Omeka – Paola Ranzini (ICTT) & Émilie Volpi (CIHAM)📜 Titre : Omeka – Atelier de formation Omeka 🧑🤝🧑 Équipe : Paola RANZINI (ICTT) – Porteuse Émilie VOLPI (CIHAM) – Porteuse 📌 Résumé : L’atelier s’organisera en deux parties : a) Présentation d’Omeka, de ses fonctionnalités et de son utilisation b) Exercices pratiques (« bac à sable »). Des profils «éditeurs» seront ouverts sur…
Lire la suite - [Clôturé] Appel à communications – 57e Colloque ASRDLF – Territoire(s) et numérique – 30 juin au 2 juillet 2020Mise à jour 16/04/2020 : Le colloque est reporté à la même période en 2021. L’appel à communications pour le 57ème colloque de l’Association de Science Régionale de Langue Française (ASRDLF), organisé cette année par l’UMR ESPACE à Avignon Université (France), du 30 juin au 2 Juillet 2020 avec pour thème « Territoire(s) et numérique. Innovations,…
Lire la suite - [Projets 2019] LEDI – Ouassim Hamzaoui (LBNC)📜 Titre : LEDI – Analyses Lexicographique et Epidémiologique des Discours médiatiques, institutionnels et politiques sur l’Immigration (1947-2017) 🧑🤝🧑 Équipe : Ouassim HAMZAOUI (LBNC) – Porteur Guillaume MARREL (LBNC) Pierre JOURLIN (LIA) Marianne BEAUVICHE (ICTT) Anika FALKERT (ICTT) Graham RANGER (ICTT) 📌 Résumé : À partir du cas d’étude que constitue ladite « crise des…
Lire la suite - [Projets 2019] RELOSP – Benjamin Landais & Mounir Redjimi (Espace)📜 Titre : RELOSP – Reconstituer les logiques spatiales des transformations foncières dans un contexte seigneurial et colonial (Banat, XVIIIe-XIXe siècles) 🧑🤝🧑 Équipe : Benjamin LANDAIS (CNE) – Porteur Mounir REDJIMI (Espace) – Porteur 📌 Résumé : La dimension spatiale de l’usage familial des terres dans les sociétés rurales d’Ancien Régime est mal connue. Les…
Lire la suite - [Projets 2019] RO-Cat – Johnny Douvinet (Espace)📜 Titre : RO-Cat – Les réseaux opportunistes face aux catastrophes naturelles 🧑🤝🧑 Équipe : Johnny DOUVINET (Espace) – Porteur Esteban BOPP (Espace) Rachid ELAZOUZI (LIA) Eitan ALTMAN (INRIA) 📌 Résumé : Les catastrophes naturelles connaissent une recrudescence aujourd’hui, en liens avec le contexte de changement climatique en cours et d’exposition accrue des populations dans…
Lire la suite - [Projets 2019] JHN – Emilie Volpi (CIHAM)📜 Titre : JHN – Journée Humanités Numériques 🧑🤝🧑 Équipe : Emilie VOLPI (CIHAM) – Porteuse 📌 Résumé : Les Humanités numériques (digital humanities) désignent au sens très large les méthodes liées à l’utilisation et au développement d’outils numériques dans les sciences humaines et sociales, posant la question des nouvelles possibilités offertes par les objets…
Lire la suite - [Projets 2019] AdS – Guillaume Marrel (LBNC)📜 Titre : AdS – Initiation à l’analyse de séquences 🧑🤝🧑 Équipe : Guillaume MARREL (LBNC) – Porteur Vincent LABATUT (LIA) Noémie FÉVRAT (LBNC) Étienne OLLION (École Polytechnique) 📌 Résumé : Ces dernières décennies, l’étude quantitative des trajectoires biographiques (life course analysis) s’est développée en sciences sociales notamment, à partir de corpus de données longitudinales…
Lire la suite - [Projets 2019] NUMIMMO – Guilhem Boulay (Espace)📜 Titre : NUMIMMO – Numériques et marché immobilier 🧑🤝🧑 Équipe : Guilhem BOULAY (Espace) – Porteur Rachid ELAZOUZI (LIA) Claire JUILLARD (consultante) Renaud LE GOIX (Université Paris 7) Ronan YSABAERT (Université Paris 7) Ghislain GÉNIAUX (INRA Avignon) Thomas LEFEBVRE (meilleursagents.com) 📌 Résumé : L’objectif de la journée est de développer les thématiques suivante :…
Lire la suite - [Journée d’étude] NACLA2 – Corpus et textes de représentation – 15 juin 2018La journée d’étude “Corpus et textes de représentation” aura lieu le 15 juin prochain, à l’Université d’Avignon et des Pays de Vaucluse (site Hannah Arendt, centre ville). Programme de la journée Corpus et textes de représentation 9h15 : Ouverture. Rachid El Azouzi et Eric Triquet de la FR Agorantic ; Madelena Gonzalez du laboratoire ICTT.…
Lire la suite - [Projets 2018] GoOW – Guillaume Marrel (LNBC)📜 Titre : GoOW – Gouvernance des corpus scientifiques d’étude du Web 2.0 🧑🤝🧑 Équipe : Guillaume MARREL (LBNC) – Porteur Martine LE FRIANT (LBNC) Bérengère GLEIZE (LBNC) Samuel PRISO (LBNC) Ouassim HAMZAOUI (LBNC) Éric SANJUAN (LIA) Pierre JOURLIN (LIA) Malek HAJJEM (LIA) 📌 Résumé : Toutes les données qui constituent et que génèrent en…
Lire la suite - [Séminaire] Gouvernance des corpus de données pour l’étude du Web 2.0 – 21 novembre 2017Agor@ntic – Axe 3 : Politique(s), transparence et éthique LBNC & LIA Mardi 21 novembre 2017, 14h-17h, Campus Hannah Arendt – Salle 2W40 Une table ronde autour de l’évolution des pratiques des médias sociaux-numériques et de la réglementation du Web 2.0 sur le partage scientifique et l’instabilité des corpus de microblogging dans le temps a…
Lire la suite - [Atelier] MLC-R : Méthodes en linguistique de corpus avec RJournée d’atelier/ formation consacrée à la présentation, la prise en main et la manipulation de l’environnement R pour l’exploitation de corpus textuels dans le but d’en extraire des données linguistiquement pertinentes (fréquences, concordances, cooccurrences de divers ordres). Il s’agira d’accompagner un nombre limité de participants (étudiants et chercheurs) dans la découverte et la pratique d’un…
Lire la suite - [Projets 2017] MLC-R – Graham Ranger (ICTT)📜 Titre : MLC-R – Méthodes en linguistique de corpus avec R 🧑🤝🧑 Équipe : Graham RANGER (ICTT) – Porteur Guillaume DESAGULIER (MoDyCo) 📌 Résumé : Journée d’atelier/ formation consacrée à la présentation, la prise en main et la manipulation de l’environnement R pour l’exploitation de corpus textuels dans le but d’en extraire des données…
Lire la suite - [Journée d’étude] Rencontres autour d’Agorantic – 7 décembre 2016Travail sur le nouveau projet Le mercredi 7 décembre 2016, une cinquantaine de chercheurs et doctorants membres de laboratoires rattachés à la (S)FR Agorantic, ou en passe de le devenir, se sont réunis sur le Campus Hannah Arendt de l’Université d’Avignon et des Pays de Vaucluse pour participer à un séminaire interne de la (S)FR.…
Lire la suite - [Projets 2016] NACLA – Graham Ranger (ICTT)📜 Titre : NACLA – Nouvelles approches du corpus en linguistique anglaise 🧑🤝🧑 Équipe : Graham RANGER (ICTT) – Porteur Richard DUFOUR (LIA) Anika FALKERT (ICTT) 📌 Résumé : Le colloque vise à rassembler des chercheurs en linguistique de divers horizons, dans la recherche de synergies potentielles entre, d’un côté, une linguistique dont l’objectif est…
Lire la suite - [Projets 2015] MC² – Éric Sanjuan (LIA)📜 Titre : MC² – Musées et Contextualisation Culturelle 🧑🤝🧑 Équipe : Éric SANJUAN (LIA) – Porteur Pierre JOURLIN (LIA) Vincent LABATUT (LIA) Juan Manuel TORRES MORENO (LIA) Marie-Sylvie POLI (CNE) Florence ANDREACOLA (CNE) 📌 Résumé : Ce projet s’appuie sur l’expérience du LIA dans les domaines du Traitement Automatique de la Langue Naturelle (TALN)…
Lire la suite
















