Présentation

Le Groupe de Travail Big Data de l'IFB a pour objectif de fédérer la communauté française autour de la thématique de l'intégration et l'analyse de grandes masses de données hétérogènes.

Le groupe de travail comporte 3 axes principaux.

  • Axe ELIXIR/EXCELERATE.

ELIXIR/EXCELERATE vise à concevoir une Infrastructure de recherche (ESFRI) Européenne en Bioinformatique. L'objectif est d'offrir des services en accès aux données, aux outils, capacité de calcul, développement de standards et bonnes pratiques, intégration et interopérabilité des données et des services. Elixir/Excelerate contient aussi un volet formation très important.

L'IFB est le noeud francais du réseau ELIXIR/EXCELERATE. Dans ce contexte, l'axe Elixir/Excelerate du groupe de travail IFB Big Data aura les objectifs suivants :

(a) Informer et rendre compte à la communauté francaise des décisions et avancées qui ont lieu dans le projet Européen ELIXIR/EXCELERATE en particulier autour des WP relatifs (i) à la constitution d'un catalogue de services, (ii) aux aspects calculs, (iii) à la constitution d'une plateforme d'interopérabilité pour le traitement des données biologiques et la découverte de services(forte utilisation d'ontologies et de meta-données), (iv) aux "use case" où la France est fortement présente, en particulier "maladies rares" et "Plantes".

(b) Collecter les besoins des membres des plateformes francaises et faire remonter ces besoins dans les WPs Européens

(c) Informer et diffuser les informations relatives aux formations Européennes effectuées dans le cadre ELIXIR/EXCELERATE.

(d) Informer et diffuser les appels à participation à des projets ciblés ou à des soumissions directement liés au projet ELIXIR/EXCELERATE.

  • Axe 2. Systèmes de gestion de données massives.

L'objectif de cet axe est de dresser un panorama des outils existants permettant de gérer efficacement les données biologiques massives. Aujourd'hui, il existe un grand nombre de solutions offertes par le monde universitaire et professionnel. L'objectif de cet axe sera de partager des expériences acquises sur ces outils afin d'en évaluer les limites et définir les challenges à dépasser. 

L'animation de cet axe aura pour objectif :

(a) de diffuser, informer et former en organisant des tutoriaux et retours d'expériences sur les outils.

(b) d'organiser et animer des évènements de type Hackathons pour tester les outils sur des jeux de données réels, issus des plateformes IFB.

  • 3. Axe Reproductibilité.

Cet axe est constitué des membres du groupe du groupe de travail ReproVirtuFlow du GDR MaDICS (mais il est ouvert à tous !), dont l'objectif est de dresser un état des lieux sur les capacités des différents outils existants de permettre (ou non) de reproduire (à l'identique ou de façon similaire) des résultats d'expériences. Les 3 grands piliers de la reproductibilité sont les workflows scientifiques (trace des outils utilisés lors d'une expérience et de leur ordre d'utilisation), la provenance (trace de l'exécution concrète d'une expériences, paramétrages des outils, données prises en entrées et générées par les différentes étapes) et les machines virtuelles (trace de l'environnement dans lequel s'est déroulé l'expérience). 

Dans ce contexte, l'axe reproductibilité du groupe de travail IFB Big Data aura les objectifs suivants:

(a) Organiser et animer des évènements de type Hackathons et BYOD (Bring your Own Data) pour concrètement tester les outils offerts pour reproduire des résultats d'analyse sur des jeux de données réels, issus des plateformes francaises.

(b) Diffuser, Informer et former en organisant des tutoriaux et petits cours autours des bonnes pratiques à suivre pour tendre vers une meilleure reproductibilité.

Contacts

N'hesitez pas à nous contacter.

cea
cnrs
inra
inria
inserm
logo_elixir
logo-investissements