Du 8 au 11 juillet 2025, l’Institut Français de Bioinformatique (IFB/ELIXIR-FR) était à Bordeaux pour JOBIM 2025, grand rendez-vous annuel de la communauté francophone de bioinformatique. Conférences, posters, démonstrations, échanges informels... Retour sur une édition particulièrement riche pour les équipes de l’IFB.
Dès le premier jour, le comité événement de l’IFB-core a investi le nouveau stand de l’IFB/ELIXIR-FR, installé à l’ENSEIRB-MATMECA de Talence au côté de ceux de la SFBI et des JeBIF. Les participant·es ont pu y retrouver les équipes pour répondre à leurs demandes, et y découvrir les flyers de deux des projets portés par l’IFB : ABRomics, dédiée à la surveillance génomique de la résistance aux antibiotiques, et Galaxy France, l’instance nationale de la plateforme Galaxy Project.
Une démonstration en direct d’ABRomics, présentée par Amanda Dieuaide, a permis d’illustrer concrètement le chargement des données de séquençage de génomes bactériens, traitement de ces données par les différents pipelines d’analyse, et enfin l'exploration des résultats à travers les interfaces graphiques de la plateforme. Les futures fonctionnalités de la plateforme, actuellement en cours d’implémentation, ont également été présentées.
Par ailleurs, une présentation très attendue de Madbot (#MadobotByIFB) a fait salle comble, outil innovant développé par l’IFB-core (unité coordinatrice de l’IFB) pour faciliter la gestion et le partage des données et métadonnées associées. Il automatise l’organisation, la description et la soumission des données vers des dépôts comme Zenodo ou ENA (European Nucleotide Archive), tout en respectant les standards internationaux. Résultat : des données plus ouvertes et accessibles (principes FAIR) avec un processus de soumission des données simplifié !
JOBIM, c’est aussi l’occasion de valoriser ses travaux. Et cette année encore, l’IFB était au rendez-vous avec une belle représentation qui reflètent la diversité et la complémentarité de nos activités.
La Communauté Biodiversité, co-pilotée par l’IFB et le PNDB (Pôle national des données de biodiversité de DATA Terra), s’engage pour une meilleure gestion des données génomiques pour diverses applications. Dans le cadre du projet MUDIS4LS, un focus particulier est mis sur les organismes marins et les données de recherche sur la biodiversité marine : plans de gestion des données, bonnes pratiques et infrastructures nationales sont au cœur des travaux pour rendre la recherche plus accessible et interopérable.
Dans le cadre de nos activités de nœud français de l’infrastructure européenne ELIXIR Europe, l’IFB joue un rôle clé dans le développement des compétences en bioinformatique au niveau européen. Le poster a permis de présenter les projets sur lesquels nous sommes impliqués comme TeSS, Training Metrics Database, Learning Paths et SPLASH, ... mais également la formation des formateurs avec notamment le réseau de formation Galaxy, l'intégration multi-omique, l'apprentissage automatique... ou encore l'organisation de formation multi-nœuds sur l'IA.
Le programme de recherche ATLASea a pour but de séquencer les génomes de 4500 espèces marines eucaryotes, soit environ un tiers des espèces marines connues de l’hexagone et des territoires ultramarins. Les données récoltées sont déposées dans une base de données en libre accès pour la communauté scientifique, BYTEsea. Le projet BYTEsea, piloté par l’IFB, garantit l’interopérabilité et la sécurité des données du programme ATLASea, et facilite leur diffusion et leur utilisation conformément aux principes FAIR et Open Science.
Créé en 2005, Galaxy prend en charge divers domaines scientifiques et a été largement adopté en France, avec plus de 10 serveurs et UseGalaxy.fr comme instance nationale. Mais Galaxy, ce n’est pas seulement un outil d’analyse adapté à la génomique ! Acteur clé de l’open science computing, il offre plus de 3 000 outils pour des domaines variés comme la métabolomique, l’apprentissage automatique et l’écologie. Soutenu par l’IFB et ELIXIR, avec une communauté active, UseGalaxy.fr soutient des projets d’envergure et facilite des analyses complexes, tout en garantissant une expérience utilisateur intuitive et des workflows conformes aux principes FAIR.
Pour plus de détails, consultez l'article dédié sur Galaxy Project.
Les progrès technologiques ont accru les besoins en compétences informatiques en sciences de la vie, mais de nombreux chercheurs ne sont malheureusement pas assez formés sur le gestion et l’analyse des données. Pour combler ce manque, le Galaxy Training Network a créé une plateforme ouverte de formation FAIR autour de l’outil Galaxy. Galaxy Training Platform propose plus de 450 tutoriels, 135 heures de vidéos et mobilise plus de 450 contributeurs de la communauté Galaxy. La plateforme est également devenue un outil clé pour les enseignants, et offre désormais des ressources dédiées à la formation des formateurs.
Le poster présentait UseGalaxy.fr, l’instance française de la plateforme Galaxy portée par l’Institut Français de Bioinformatique (IFB) qui joue un rôle clé dans l’avancement de la bioinformatique en France. Grâce à une infrastructure de calcul performante, plus de 3 000 outils et une communauté engagée, elle facilite l’analyse des données pour des milliers d’utilisateurs. Venez découvrir notre présentation de l’écosystème Galaxy en France, ses cas d’usage concrets, et son intégration dans des projets scientifiques d’envergure nationale et européenne.
Développé dans le cadre du projet DeepImpact, un nouveau modèle de données RDF est en cours de développement pour décrire les holobiontes végétaux et les données environnementales. Ce modèle, interopérable, pourra également être utilisé pour des projets ne décrivant que des microbiotes ou des données environnementales, favorisant ainsi la reproductibilité des analyses. Ce projet sera ensuite intégré dans un système d’information afin de faciliter la collecte, le stockage et l’accès aux données.
La plateforme numérique ABRomics dédiée à la surveillance génomique et la recherche sur l’antibiorésistance, dont le développement est porté par l’IFB et l’Institut Pasteur, a présenté 2 posters dédiés.
Le premier poster a permis d’exposer les futurs workflows métagénomiques Galaxy utilisés par ABRomics, et de présenter les trois pipelines proposés, qui permettront de caractériser la résistance aux antibiotiques sans passer par l’isolement bactérien, en s’appuyant directement sur les échantillons environnementaux, animaux ou humains.
Le second poster présentait le graphe de connaissances utilisé par ABromics, afin d’assurer la structuration des données de la plateforme et son interopérabilité. Ce graphe intègre les dimensions temporelles et géographiques, conformément aux principes FAIR (faciles à trouver, accessibles, interopérables et réutilisables).
EDAM est une ontologie normalisant les termes pour l’analyse des données en sciences de la vie. Le projet open-science Bioconductor, qui propose plus de 2000 paquets à un large éventail d’applications de bioinformatique, utilise biocViews, un vocabulaire développé en interne, mais limité par son interopérabilité. L’objectif de ce projet vise à annoter les packages Bioconductor avec EDAM pour les intégrer automatiquement à l’écosystème ELIXIR pour améliorer la visibilité et l'interopérabilité des paquets. Des scripts et des méthodes basées sur des LLM facilitent cette transition, améliorant la FAIRification des ressources et les liens entre Bioconductor et ELIXIR.
L'ensemble de ces présentations et posters sont publiés et à retrouver dans leur intégralité dans la collection HAL de l’IFB-core.