L'IFB est le noeud français de l’infrastructure européenne de bioinformatique ELIXIR, soit ELIXIR-FR. L’IFB-core, en tant que noeud national de l’IFB, est en relation avec le hub européen d’ELIXIR à Hinxton. Organisation intergouvernementale qui développe une infrastructure Européenne distribuée, ELIXIR permet aux scientifiques dans le domaine des sciences de la vie d’accéder à des ressources telles que des bases de données, des outils logiciels, du matériel de formation, du stockage cloud et des clusters de calcul. Les expériences en Science de la vie génèrent un volume de données et un nombre de logiciels immenses et en augmentation exponentielle. Il est nécessaire de stocker les données, de les rendre accessibles, interopérables et sûres. L’objectif d’ELIXIR est de coordonner ces ressources pour former une infrastructure unique permettant aux scientifiques de trouver et de partager des données, d’échanger des compétences et de convenir des meilleures pratiques dans toute l’Europe.
La mission d'ELIXIR-FR est de doter la communauté bioinformatique française d'outils et d'expertise afin d'améliorer son offre de services auprès des chercheurs. ELIXIR-FR assure la pérennité des ressources bioinformatiques nationales, participe au développement d'une infrastructure durable de stockage, de traitement et d'analyse des données des sciences de la vie et donne accès à des outils et formations pour faciliter ces activités.
ELIXIR-FR contribue aux activités des plateformes et des communautés d’ELIXIR en s’assurant que les ressources bioinformatiques développées par la communauté française s’intègrent dans l’offre de service Européenne.
> Coordination des activités de ELIXIR-FR
Direction du noeud : Claudine Médigue and Jacques van Helden
Chef adjoint du noeud: Anne-Françoise Adam-Blondon
Coordinateurs techniques : Christophe Blanchet; Olivier Collin
Coordinateur de formation : Victoria Dominguez del Angel
ELIXIR-FR a organisé le premier BioHackathon ELIXIR à Paris en 2018
Les services d’ELIXIR-FR comprennent des bases de données, des outils, des infrastructures informatiques et des services de formation qui sont importants pour la communauté française travaillant dans le domaine de la bioinformatique pour les sciences de la vie. De plus, ces outils doivent être alignés sur les recommandations de bonnes pratiques des plateformes d’ELIXIR, dans une dynamique de science ouverte et raisonnablement durable.
ANISSED est la principale base de données d'organismes modèles pour la communauté mondiale des scientifiques travaillant sur une classe d'invertébrés marins, les tuniciers (groupe sœur des vertébrés). Elle intègre pour chaque espèce : une base de connaissances principale avec des informations étendues sur la fonction des gènes, l'expression des gènes, la phylogénie et l'anatomie embryonnaire à une résolution cellulaire unique ; un navigateur de génomique et un navigateur de synthèse de gènes Genomicus.
Patrick Lemaire & Christelle Dantec
Bio.tools link
ARIA (Ambiguous Restraints for Iterative Assignment) est un logiciel pour l'attribution automatique des NOEs et le calcul de la structure de la RMN. Il accélère et automatise le processus d'attribution grâce à un protocole itératif.
Benjamin Bardiaux & Michael Nilges
Bio.tools link
AuReMe est un espace de travail adaptable pour des reconstructions ou des améliorations durables de modèles métaboliques à l'échelle du génome impliquant des pipelines personnalisés. Il est adapté à l'étude métabolique d'organismes et de microbiomes non conventionnels afin de garantir que le processus est reproductible et documenté quelle que soit la combinaison d'outils utilisée. Parmi les modules inclus dans l'environnement AuReMe, on trouve notamment un module de gestion de modèle PADmet, un module d'exportation wiki, un outil de comblement de lacunes pour les organismes non conventionnels (meneco), un outil de réduction des communautés microbiennes basé sur les complémentarités métaboliques (miscoto) et un progiciel permettant de gérer l'analyse du microbiote à grande échelle (Metage2Metabo).
Anne Siegel & Jeanne Got
Bio.tools link
BISE/BIII Le BIII Bio Image informatics Index (www.biii.eu) est une base de données de connaissances sur les outils logiciels, les bases de données d'images de test et le matériel de formation pour l'analyse des bio-images. Les outils logiciels sont organisés sous forme de protocole d'analyse complet (workflow), de brique spécifique (composant) pour construire un workflow, ou de plate-forme logicielle ou de bibliothèque (collection). Ils sont décrits en utilisant Edam Bio Imaging, qui est défini de manière itérative à l'aide de ce site web. Toutes les entrées sont exposées selon les principes FAIR et sont accessibles pour d'autres usages avec la licence (ODC-By) v1.0.
Perrine Paul-Gilloteaux
Bio.tools link
CRISPRCas ++ est un nouveau site web contenant un programme appelé CRISPRCasFinder pour détecter les éléments CRISPR et les gènes cas dans le génome des procaryotes. CRISPRCasMeta est adapté à l'analyse de grandes données de métagénomique. Les programmes sont disponibles en ligne ou peuvent être téléchargés pour un usage local. Une base de données appelée CRISPRCasdb, le successeur de CRISPRdb, est accessible sur le site web de CRISPRCas++. Elle peut être parcourue et interrogée à la recherche de séquences répétées et d'espaceurs.
Christine POURCEL
Bio.tools link
FAIDARE est un portail développé par ELIXIR-FR au service de la communauté des sciences végétales ELIXIR. FAIDARE permet la découverte de données sur les plantes réparties dans des fédérations de systèmes d'information distants qui ont mis en place une API standardisée, la BrAPI. FAIDARE permet actuellement de faire des recherches sur des données d'accessions de ressources génétiques, de phénotypage et de génotypage.
Anne-Françoise Adam-Blondon
Bio.tools link
GenomeHubs Le South Green Genome Hub est un ensemble de portails communautaires spécifiques aux cultures qui permettent de gérer les ensembles de données génomiques en mettant l'accent sur les plantes tropicales et méditerranéennes. Actuellement développés sur la banane, le manioc, le cacao, le café, l'herbe, le riz et la canne à sucre, les hubs génomiques donnent accès à de multiples ensembles de données (par exemple, des assemblages, des informations sur les produits géniques, les voies métaboliques, les familles de gènes, la transcriptomique et les marqueurs génétiques).
Gaetan Droc
Bio.tools link
GENOMICUS Genomicus est une base de données qui intègre des données de génomes modernes et ancestraux (reconstruits algorithmiquement) dans un objectif de génomique comparative. Cette base de données est navigable via une interface web intuitive. Ce serveur permet aux utilisateurs de naviguer dans les génomes en plusieurs dimensions: linéairement le long des chromosomes, transversalement à travers les différentes espèces, et chronologiquement selon un axe évolutif. Une interface graphique conviviale permet des comparaisons de conservations de synténie et d'ordre de gènes entre paire de génomes ou de multiples génomes à différentes échelles: selon l'ordre local des gènes sur les chromosomes, par comparaison de caryotypes, grâce à des représentations de matrice de conservation entre génome, etc. Différents phylums tels que celui des vertébrés, des plantes, des champignons, ou des métazoaires non vertébrés (selon Ensembl et Ensembl Genomes) sont représentés et régulièrement mis à jour (selon les release des bases de données Ensembl et Ensembl Genomes), ainsi que des versions spécifiques pour des analyses sur les tunicés, les poissons téléostéens ou encore Amphioxus.
Alexandra Louis
Bio.tools link
GINsim est un système d'information modulaire et interopérable pour les plantes (cultures et forêts) et les champignons phytopathogènes de l’INRAE et de ses partenaires. GnpIS facilite l'intégration des données génomiques (principalement des annotations du génome et des polymorphismes), génétiques (QTLs, GWAS) et phénotypiques. Il est utilisé comme dépôt central du Consortium international pour la séquence du génome du blé.
Denis THIEFFRY
Bio.tools link
GnpIS est un système d'information modulaire et interopérable pour les plantes (cultures et forêts) et les champignons phytopathogènes. GnpIS facilite l'intégration des données génomiques (principalement les annotations du génome, les polymorphismes et la synthèse), génétiques (QTLs, GWAS) et phénotypiques. Il est utilisé comme dépôt central du Consortium international pour la séquence du génome du blé.
Anne-Françoise Adam-Blondon
Bio.tools link
IMGT the international ImMunoGeneTics information system®, est une ressource de connaissances intégrée spécialisée dans les immunoglobulines (IG) ou anticorps, les récepteurs des lymphocytes T (TR) et l'histocompatibilité majeure (MH) des espèces de vertébrés humaines et autres, ainsi que dans la superfamille des immunoglobulines (IgSF), la superfamille des MH (MhSF) et les protéines apparentées du système immunitaire (RPI) des vertébrés et des invertébrés. IMGT® fournit un accès commun aux données d'immunogénétique de séquence, de génome et de structure, basé sur les concepts d'IMGT-ONTOLOGIE et sur les règles du tableau scientifique IMGT.
Sofia Kossida
Bio.tools link
Life map est un outil web et une application pour mobiles permettant d'explorer l'arbre de la vie, c'est à dire les liens évolutifs entre toutes les espèces du monde vivant. La visualisation est inspirée des outils de cartographie actuels : l'exploration se fait en zoomant dans l'image et en s'y déplaçant. Cliquer sur les nœuds et les feuilles de l'arbre permet d'avoir accès à la fiche Wikipédia correspondante, qui inclue éventuellement une photographie. Lifemap permet aussi de calculer des 'routes' ou des 'itinéraires' dans l'arbre de la vie pour y repérer l'ancêtre commun le plus récent de deux taxons, ou de visualiser et de télécharger des sous-arbres pour à un ensemble de taxons renseignés par l'utilisateur. Lifemap existe dans plusieurs versions et dans plusieurs langues.
Damien de Vienne
Bio.tools link
MATRIXDB est une base de données centrée sur les interactions moléculaires des protéines de la matrice extracellulaire et des glycosaminoglycanes (GAGs). L'interface d'interrogation avancée permet aux utilisateurs de parcourir les données de MatrixDB, de construire et de visualiser des réseaux d'interaction spécifiques basés sur des données transcriptomiques ou protéomiques quantitatives, des pathologies, des processus biologiques ou des fonctions moléculaires. MatrixDB héberge l'outil de construction GAG Builder permettant de construire en ligne des modèles 3D de séquences GAG se liant à des protéines. Sylvie RICARD-BLUM
Bio.tools link
MetExplore est un serveur web gratuit et ouvert pour l'analyse des données omiques dans le contexte des réseaux métaboliques à l'échelle du génome. MetExplore permet notamment l'annotation collaborative des réseaux métaboliques. Dans le cas spécifique de la métabolomique, il fournit des algorithmes exploitant la structure du réseau métabolique tel que MetaboRank, un système de recommandation pour améliorer la constitution d'empreintes métaboliques. Une des originalités de Metexplore réside dans sa capacité à permettre une visualisation personnalisée des réseaux métaboliques à l'aide d'une bibliothèque javascript open source : MetExploreViz.
Fabien JOURDAN
Bio.tools link
Microscope est une plateforme Web intégrée pour l'annotation et l'exploration des fonctions des gènes des microorganismes au travers d'analyses comparées des génomes, pangénomes et du métabolisme. La plateforme prend en charge la soumission de génomes et de métagénomes nouvellement assemblés et fournit également des services d'analyse de données RNA-seq. L'interface utilisateur de MicroScope permet un travail collaboratif dans un contexte comparatif riche afin d'améliorer les efforts de curation communautaire.
Claudine Médigue, David Vallenet
Bio.tools link
Norine est la seule ressource consacrée aux peptides non ribosomiques (PNR). Elle contient une base de données complétée par des outils d'analyse (comparaison des structures, inférence de la structure des monomères à partir de la structure chimique, analyse du spectre de masse, annotation des PNR pour soumission à la base de données). Les PNR sont des métabolites secondaires produits par des bactéries et des champignons et présentent un spectre diversifié d'activité biologique.
Pupin Maude, Leclère Valérie, Flissi Areski
Bio.tools link
Ocean Gene Atlas Le service Ocean Gene Atlas permet d'accéder à trois objets de données complémentaires : les catalogues de séquences de gènes (ENA), le contexte environnemental des échantillons (PANGAEA) et les estimations de l'abondance des gènes dans les échantillons (calculées par la cartographie des séquences brutes lues sur les catalogues de gènes). Les requêtes de l'utilisateur sont composées soit d'une séquence (nucléique ou protéique), soit d'un modèle de Markov caché dérivé d'un alignement de séquences multiples. Les homologies de la requête utilisateur dans les catalogues de gènes sont identifiées à l'aide d'outils de recherche de similarité de séquence standard (par exemple BLAST ou HMMER), et leur abondance estimée basée sur la lecture est affichée sur des cartes du monde interactives et des parcelles écologiques. Un arbre phylogénétique est également déduit afin de situer la requête de l'utilisateur dans son contexte d'homologues du milieu marin ainsi que d'homologues connus à partir de séquences de référence.
Magali Lescot
Bio.tools link
Orphadata fournit à la communauté scientifique des ensembles de données complets et de qualité sur les maladies rares à partir de la base de connaissances Orphanet, dans des formats réutilisables, y compris un point final SPARQL.
Ana Rath & Marc Hanauer
Bio.tools link
Orphanet est la ressource de référence pour les informations sur les maladies rares et les médicaments orphelins. Orphanet fournit également des métadonnées sur les ressources pertinentes, notamment les registres et les biobanques de maladies rares, les projets de recherche, les essais cliniques, les centres d'experts et les tests de diagnostic pour plus de 30 pays. Orphanet tire de sa base de connaissances une ontologie des maladies rares, des informations sur les maladies rares et des données sur les maladies rares.
Ana Rath
Bio.tools link
ParameciumDB est une base de données communautaire sur l'organisme modèle Paramecium. Le site web donne accès aux génomes de nombreuses espèces de paramécies ainsi qu'à leurs annotations. ParameciumDB intègre également des jeux de données de séquencage (DNA-seq, RNA-seq, ChIP-seq) fournis par la communauté. Ce portail permet d'interroger, d'extraire, de visualiser et de comparer les données publiques les plus récentes.
Olivier ARNAIZ
Bio.tools link
Phylogeny.fr est un serveur web destiné aux analyses phylogénétiques, conçu pour permettre à des utilisateurs non spécialistes ou experts d'exécuter des pipelines phylogénétiques. Ces pipelines enchaînent automatiquement des programmes pour effectuer différentes tâches : l'identification des séquences homologues, leur alignement multiple, le nettoyage des sites de l'alignement, la reconstruction phylogénétique et la représentation graphique de l'arbre inféré.
Olivier Gascuel, Jean-Michel Claverie, Vincent Lefort
Bio.tools link
PhyML est un logiciel qui estime les phylogénies de vraisemblance maximale à partir d'alignements de séquences de nucléotides ou d'acides aminés. La principale force de PhyML réside dans le grand nombre de modèles de substitution couplés à des algorithmes efficaces pour rechercher dans l'espace des topologies des arbres phylogénétiques. PhyML a été conçu pour traiter des ensembles de données de taille moyenne à grande. En théorie, il est ainsi possible d'analyser des alignements comportant jusqu'à 4 000 séquences de 2 000 000 de caractères. PhyML prend en compte des ensembles de données constitués de plusieurs gènes et ajuste des modèles de substitution sophistiqués avec des composantes hétérogènes à travers les différents éléments d'une partition de génome.
Stéphane Guindon
Bio.tools link
REPET intègre des pipelines bioinformatiques dédiés à la détection, l'annotation et l'analyse des éléments transposables (TE) dans les séquences de génomes. Les principaux pipelines sont (i) TEdenovo, qui recherche des répétitions, construit des séquences consensuelles de TE et les classe en fonction de leurs caractéristiques, et (ii) TEannot, qui exploite un génome avec une bibliothèque de séquences TE, par exemple celle produite par le pipeline TEdenovo, pour fournir des annotations TE exportées dans des fichiers GFF3.
Hadi Quesneville
Bio.tools link
RSAT Regulatory Sequence Analysis Tools est une suite logicielle spécialisée pour la détection de régions cis-régulatrices dans les séquences génomiques non codantes. Elle comprend des outils pour extraire les séquences, découvrir des motifs, comparer et clusteriser ces motifs, visualiser les sites de fixation de facteurs de transcription, générer des jeux de données servant de contrôles négatifs, et d'autres utilitaires. Les outils sont accessibles via un site web (http:rsat.eu/), via des services web REST, ou installés localement sur les systèmes Linux / Mac OS X.
Jacques van Helden, Morgane Thomas-Chollier, Alejandra Medina Rivera
Bio.tools link
SulfAtlas est une base de données basée sur la connaissance qui (i) aide à mieux annoter les sulfatases dans les données (méta)génomiques et notamment à améliorer la prédiction des spécificités des substrats ; (ii) guide les biologistes expérimentaux dans la sélection des sulfatases cibles qui restent à caractériser en termes de fonction et de structure. Les données contenues dans SulfAtlas sont conservées par des experts, sur la base de notre système de classification basé sur la phylogénie et de la littérature.
Gurvan MICHEL
Bio.tools link
VarAFT est un logiciel conçu pour annoter et filtrer les données des ENG humaines. Ce système a été développé dans le cadre du projet RD-Connect et a joué un rôle déterminant dans la création de la plateforme génomique et phénologique RD-Connect. En tant que système java autonome, il assure une protection totale des données, essentielle pour une utilisation clinique. VarAFT fournit la qualité des expériences, les annotations et permet le filtrage des fichiers VCF. Les données de plusieurs échantillons peuvent être combinées pour traiter différents troubles héréditaires mendéliens, la génétique des populations ou les cancers. Il contient des caractéristiques uniques de priorisation des variantes, notamment OMIM, HPO, l'ontologie des gènes, les voies et les prédictions de UMD-Predictor et Human Splicing Finder, en plus des annotations classiques de dbNSFP . Il est utilisé par de nombreux laboratoires de recherche et cliniques dans le monde entier.
Christophe Béroud
Bio.tools link
WheatIS est un portail au service de l’initiative international sur le blé (www.wheatinitiative.org) qui permet la découverte de données de génétique et de génomique du blé réparties dans une fédération internationale de systèmes d'information distants. Le portail WheatIS permet la découverte par mot-clé de tout type de données. Il offre actuellement un point d'entrée unique aux données fournies par une douzaine d’instituts mondiaux.
Anne-Françoise Adam-Blondon
Bio.tools link
Workflow4Métabolomics est basé sur l'environnement Galaxy qui fournit des interfaces conviviales pour construire, exécuter et partager des flux de travail complets d'analyse de données et donne accès à un environnement de calcul haute performance : l'infrastructure ELIXIR-FR/IFB. Ainsi, le W4M offre plus de 40 outils pour traiter les données provenant des trois principales technologies (RMN, GCMS, LCMS), y compris des algorithmes uniques développés par les développeurs du W4M eux-mêmes. Les données et les flux de travail peuvent être réutilisés et partagés publiquement, devenant ainsi des références utiles pour la communauté. Enfin, la plateforme propose de nombreux tutoriels et un service d'assistance.
Gildas Le Corguillé
Bio.tools link
Les communautés ELIXIR correspondent à des groupes d’utilisateurs des services d’ELIXIR formellement reconnus par l’infrastructure. Elles doivent guider les développements des services long terme des plateformes pour répondre aux besoins de leurs communautés de scientifiques. Cette collaboration avec ELIXIR permet d’apporter des solutions à leurs problèmes en terme de gestion de données, de calcul en cloud et de partage de données entre pays construites sur des bases technologiques stables et fiables.
ELIXIR-FR co-coordonne en particulier plusieurs communautés :
ELIXIR-FR a des points de contact français dans les autres communautés :
Les activités de l’infrastructure ELIXIR sont organisées en 5 domaines appelés “plateformes”: Données (Data), Outils (Tools), Interopérabilité (Interoperability), Infrastructure (Compute) et formation (Training).
ELIXIR-FR a des représentants dans chacune de ces plateformes, dont le rôle est de coordonner les activités françaises:
ELIXIR propose trois type de formations en lien avec le type de participant :