Objectifs de ce séminaire

Quelques mots de contexte

Dans le domaine de l’écologie et de la biodiversité, l’augmentation des fréquences d’acquisition de données (observations de terrain, capteurs optiques, capteurs radar, télédétection, systèmes de suivi de la qualité des eaux, recensement automatique ou semi-automatique des taxons, séquençage, génotypage, etc..) a abouti à une accumulation considérable de données hétérogènes et dispersées qu’il est nécessaire d’organiser, documenter et trier pour les exploiter à des fins de recherche et d’appui opérationnel à l’expertise.

Le consortium Indexmed, rebaptisé IndexMEED pour « Indexing for Mining Ecological and Environmental Data », développe des processus d'indexation et de qualification de données, hétérogènes et distantes. Ces processus permettent de construire des graphes à partir de données concernant la biodiversité et de les exploiter avec des objectifs d'indication, d'aide à la décision et de formulation de nouvelles hypothèses scientifiques. Les graphes permettent de représenter et d’explorer des interactions entre des objets d’observation ou d’expérimentation, des variables mesurées, des paramètres pris en compte.

Les graphes sont un des axes phares de développement de nouvelles approches, d’analyses intégratives et de la représentation des données complexes pour la recherche en écologie :

  • Cet outil intégré crée un cercle vertueux sur tout le cycle de vie des données puisqu’un travail préalable de qualification des jeux de données (nettoyage, homogénéisation, organisation de l’information, amélioration des descripteurs) est nécessaire pour obtenir des résultats visuels analysables;
  • Il permet de parcourir les liens entre les données et de formuler de nouvelles hypothèses, de combiner des objets et d’explorer leurs relations statistiques.

Après deux éditions consacrées à l’indexation des données à des fins d’harmonisation des systèmes d’information en respectant les objectifs et les contraintes métiers des acteurs, les 3èmes journées du consortium IndexMeed ont mis en évidence ce potentiel des approches basées sur les graphes - déjà éprouvées dans d’autres domaines du « big data » - pour la fouille de données ainsi que les lacunes en termes de compétences et d’expérience de la communauté de recherche en écologie pour adapter et utiliser ces approches.

Partant de ce constat, le consortium IndexMEED organise une série d’évènements transdisciplinaires pour, in fine :

  • Formaliser des besoins en terme d’analyses complexes de la part des producteurs et des utilisateurs de données dans le domaine de l’écologie et de la biodiversité;
  • Stimuler la recherche en Sciences et Techniques de l’Information et de la Communication (STIC) afin de proposer des solutions plus adéquates pour l’analyse et la gestion des données environnementales (couvertures spatio-temporelles, niveaux d’organisation, données multi-échelles…).

Organisation des journées des SAGES

Le séminaire national IndexMEED 2017, baptisé Journées des Sciences et Algorithmes autour des Graphes en Environnement et Sociétés est pensé comme un espace collaboratif entre des experts en écologie et biodiversité et des experts du domaine des STIC, et a pour vocation de développer de nouvelles recherches basées sur les approches liées aux graphes, et notamment de construire un projet portant i) sur les aspects théoriques (STIC) des algorithmes pour fouiller les graphes en fonction des questions scientifiques et ii) sur les aspects théoriques de l’intégration de données hétérogènes environnementales dans un objectif de construction de bio-scenarios et d’aide à la décision environnementale; ce séminaire est ouvert à tous.

  • La première journée sera consacrée aux résultats des ateliers et aux échanges entre chercheurs en écologie et chercheurs en STIC.
  • La deuxième journée sera consacrée à une réflexion sous forme d’ateliers concernant les verrous théoriques à lever (STIC) concernant les données environnementales, et à l’élaboration d’une réponse à un appel à projets pour une action spécifique aux graphes de données environnementales.
  • Une troisième journée rassemblera un groupe restreint de chercheurs pour structurer la réponse à appel à projet selon des Work Package cohérents 

Objectifs des journées des SAGES

Suite au succès des précédents rendez-vous du consortium depuis 2014, ce quatrième séminaire présentera les récents développements autour des algorithmes utilisés pour extraire de graphes des questions de recherche en environnement. Il promouvera les échanges entre participants, l'acquisition de méthodes et explorera de nouvelle façons de développer des algorithmes pour fouiller les graphes construits sur la base de données hétérogènes en environnement.

Les objectifs, après avoir partagé les preuves scientifiques et les expériences, sont de développer des collaborations utilisant/basées sur les approches graphes et de nouveux sujets de recherche en Europe, et de répondre à un appel européen H2020 l'an prochain. Les trois jours du séminaire seront composés de quatre sessions en plénière avec des orateurs internationaux, des évènements sociaux, une session posters et deux ateliers de travail (le premier jour avec les personnes intéressées et souhaitant contribuer aux réponses à appel à projet, le deuxième jour avec les futurs leaders des différentes tâches identifiées). Les plénières seront conscracrées à la présentation de différents cas d'études, et d'une co-construction d'un premier arbre de décision sur les méthodes appropriées. 

Personnes connectées : 1