Axes majeurs d'innovation

    Plan de gestion de données 

    L’IFB a la volonté de promouvoir la science ouverte, en développant des ressources pour rendre les données des sciences de la vie et de la santé trouvable, accessible, interopérable et réutilisable (FAIR). Il s’agit notamment de rédiger des Plans de gestion des données - PGD/DMP (Data Management Plan)- lors de la conception initiale des projets de recherche, et de les faire évoluer d’un document statique à un outil accessible par programme, actionnable par une machine, afin de rationaliser les flux de données entre les différents lieux d’hébergement (production de données, stockage rapide pendant la phase d’analyse, sécurisation à moyen terme, et dépôts à long terme). Le DMP sera également articulé avec le livre de laboratoire électronique, qui offre aux scientifiques du vivant une interface conviviale et puissante pour consigner leurs recherches, des expériences sur banc d’essai aux analyses informatiques.
    L’IFB envisage le déploiement du courtage de données de services destinés à aider les scientifiques du vivant à déposer leurs données dans des dépôts nationaux et internationaux dans des formats normalisés. L’IFB encourage également le développement d’une culture FAIR, en formant les scientifiques du vivant à l’accès, au partage et à l’utilisation des données scientifiques. 

    L’IFB aspire créé des environnements logiciels mieux adaptés à la science ouverte, notamment en avançant de nouvelles méthodologies (intégration continue, versionnement du code, tests fonctionnels) mais aussi le déploiement de technologies modulaires et polyvalentes (Ansible, Conda, Containers). Il s’agit notamment de transformer les plans de gestion des données d’un document statique en un outil vivant, alimenté par un accès aux programmes maDMP, systématiquement invoqué aux étapes principales d’un projet de recherche : allocation de ressources numériques, définition des droits d’accès, transferts de données entre les sites de production, d’analyse, de préservation et de dépôt. Cette évolution sera menée en synergie avec les efforts internationaux entrepris par ELIXIR dans le cadre du projet ELIXIR-CONVERGE

    • DMP modulaires: jetant les bases d’un cadre général permettant aux scientifiques du vivant de gérer leurs données de manière transparente à chaque étape de leurs projets. 
    • MaDMP: généralisation et orchestration des flux de données via MaDMP tout au long de leur vie. L’utilisation des MaDMPs pour lisser les flux de données entre les différentes étapes du cycle de vie des données engagera la communautés de sciences de la vie à adopter les principes FAIR (Findable, Accessible, Interoperable and Reusable) à chaque étapes de leurs projets. Le MaDMP transformera concrètement la gestion des données en un processus dynamique, permettant de rationaliser les flux de données entre les différents sites hébergeant les données à leurs différentes étapes (production, analyse, ouverture au public). 

    Depuis mars 2020, l’IFB a initié un projet de développement des plans de gestions de données pour les sciences de la vie exploitables par des machines (maDMP4LS). Ce projet aide à gérer l’attribution des ressources (calcul et stockage) par un accès programmatique aux données des plans de gestion déposés dans le DMP OPIDoR à l’INIST. Cela amènera les chercheurs à concevoir des données tout au long du cycle de vie de la recherche. Il transformera également le DMP en un système dynamique et adaptable de document qui sera mis à jour au cours des projets de recherche pour demander des ressources supplémentaires dès que l’évolution du projet l’exige.

    maDMP4LS

    Financé par l’ANR, et en collaboration avec l’INIST, l’IFB a lancé le projet maDMP4LS qui a pour objectif de “mettre le plan de gestion des données automatisé dans les mains des biologistes”. Ce projet envisage le déploiement et l’intégration du Plan de Gestion de Données (PGD) dans le processus scientifique par le biais d’une intégration logicielle de DMP OPIDoR, outil de conception de PGD, grâce à l’infrastructure de stockage et de calcul de l’IFB et avec la plateforme CeSGO qui fédère des outils de collaboration, gestion de projet, stockage et extraction de données. Il en résulte une plateforme d’outils informatiques interconnectés avec PGD rendu ainsi “machine-actionable” (maDMP): le PGD alimente les outils de traitement et gestion de données, et est à son tour actualisé par ces mêmes outils. Il est ainsi synchronisé avec le projet tout au long de son cycle de vie. A travers ce projet, l’IFB souhaite simplifier le suivi de la gestion et du stockage des données mais aussi augmenter le degré de conformité des données avec les principes FAIR. Cette démarche permettra la promotion du PGD en tant qu’outil d’aide à la production et à la valorisation des résultats scientifiques plutôt qu’un fardeau administratif. En outre, la transmission de bonnes pratiques communautaires à travers le DMP permettra de définir un environnement propice à la “FAIRification” des données. A plus long terme, il est envisagé d’interfacer DMP OPIDoR avec d’autres éléments logiciel et services intervenant dans le cycle de vie des données et de transposer ce concept d’intégration à d’autres domaines de la recherche. Ainsi, tous les éléments du PGD seront mis en oeuvre et FAIR deviendra alors une réalité pour une science ouverte et accessible.

    IFB - Institut Français de Bioinformatique ♦ CNRS UMS 3601 ♦ IFB-Core, Génoscope - 2 rue Gaston Crémieux, 91057 - ÉVRY – CEDEX ANR-11-INBS-0013236
    magnifiercross linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram