MIGALE

Adresse postale
Unité MaIAGE
Domaine de Vilvert 78350 Jouy-en-Josas
Structure(s) :
INRA
Unité :
MaIAGE, UR 1404
Pôle regional :
ApliBio, Ile-de-France
Responsable(s) scientifique
Responsable(s) opérationnel
Certificat(s)
  • CATI / CTAI
  • CNOC (INRA)
  • France-Génomique
  • ISO 9001
  • Label IBiSA
  • PF stratégique nationale INRA
  • RIO
Type d'infrastructure
Propriétaire
Capacité de stockage
170.00 To
Ferme de calcul
600 cores
Collection de données
17
Heure de CPU
2 240 000 H / an
Outils bioinformatiques
140
Nombre d'utilisateurs
600

Condition d'accès

Gratuit sur demande de compte

Aucun site web renseigné
Visites annuelles :
Non renseignées
Visites uniques :
2 174 an
Citations :
51
Dernière mise à jour :
Non renseignée

MOSAIC

Description

MOSAIC est une base de données relationnelle qui permet de comparer des génomes bactériens d'une même espèce au niveau nucléique et de définir le squelette et les boucles.

Chiapello H, Gendrault A, Caron C, Blum J, Petit MA, Karoui El M: MOSAIC: an online database dedicated to the comparative genomics of bacterial strains at the intra-species level. BMC Bioinformatics 2008, 9:498.

Conditions d'accès

Accès gratuit à http://genome.jouy.inra.fr/mosaic

Aucun site web renseigné
Visites annuelles :
Non renseignées
Visites uniques :
350 an
Citations :
Non renseignées
Dernière mise à jour :
Non renseignée

Insyght

Description

Insyght est un browser qui permet de naviguer entre des données d’homologie, de synténie et d’annotation des protéines de 407 génomes complets de bactéries. La ressource a été publiée en décembre 2014 : Lacroix T, Loux V, Gendrault A, Hoebeke M, Gibrat J-F: Insyght: navigating amongst abundant homologues, syntenies and gene functional annotations in bacteria, it's that symbol! Nucleic Acids Res 2014.

Conditions d'accès

Accès gratuit à http://genome.jouy.inra.fr/Insyght/

Visites annuelles :
6 000 an
Visites uniques :
Non renseignées
Citations :
71
Téléchargements :
Non renseigné

AGMIAL

Description

AGMIAL, plate-forme d’annotation de génomes microbiens.
Bryson K, Loux V, Bossy R, Nicolas P, Chaillou S, van de Guchte M, Penaud S, Maguin E, Hoebeke M, Bessières P, Gibrat JF: AGMIAL: implementing an annotation strategy for prokaryote genomes as a distributed system. Nucleic Acids Res 2006, 34:3533–3545.

Conditions d'accès

Le logiciel peut être téléchargé gratuitement sur le site http://genome.jouy.inra.fr/agmial. Il est également possible de demander l’installation d’une instance d’AGMIAL sur les machines de la plate-forme MIGALE.

Aucun site web renseigné
Visites annuelles :
250 an
Visites uniques :
Non renseignées
Citations :
Non renseigné
Téléchargements :
Non renseigné

IGO

Description

IGO est un portail permettant de croiser des informations entre différents outils de l’unité (Insyght, Mosaic, Prose, Pareo, Subtilis Expression Browser)

Conditions d'accès

Accès gratuit à http://migale.jouy.inra.fr/IGO

Aucun site web renseigné
Visites annuelles :
588 722 an
Visites uniques :
Non renseignées
Citations :
1
Téléchargements :
Non renseigné

Portail Galaxy de la plateforme MIGALE

Description

Mise en ligne d’outils et de workflows.

Mise à jours en janvier 2015

Conditions d'accès

Accès gratuit avec un compte à http://migale.jouy.inra.fr/galaxy/

Aucun site web renseigné
Visites annuelles :
Non renseignées
Visites uniques :
Non renseignées
Citations :
1 021
Téléchargements :
Non renseigné

GOR IV

Description

OR IV est un programme de prédiction de la structure secondaire des protéines. 3 états sont pris en considération : l'hélice alpha (H), les brins bêta (b) et les structures apériodiques (C). Ce programme est basé sur des considérations statistiques issues de la théorie de l'information. Il n'utilise pas d'alignement multiple. Il fournit un résultat Q3 de 65%.

Conditions d'accès

Le logiciel peut être téléchargé gratuitement sur le site http://migale.jouy.inra.fr/sites/all/downloads/Mig/Logiciels/GOR_IV.tar.gz

Aucun site web renseigné
Visites annuelles :
Non renseignées
Visites uniques :
Non renseignées
Citations :
84
Téléchargements :
Non renseigné

KAKSI

Description

KAKSI est un programme d'assignation de la structure secondaire des protéines. L'assignation des structures secondaires : l'hélice alpha (H), les brins bêta (b), les tournants (T) et les structures apériodiques (C) est effectuée sur la base des distances entre les carbones alpha et des angles phi et psi de la chaîne principale. Le programme calcule aussi la courbure de la chaîne principale.

Conditions d'accès

Le logiciel peut-être téléchargé gratuitement sur http://migale.jouy.inra.fr/sites/all/downloads/Migale/Outils/kaksi.tarba...

Aucun site web renseigné
Visites annuelles :
Non renseignées
Visites uniques :
Non renseignées
Citations :
9
Téléchargements :
Non renseigné

DOMIRE

Description

DOMIRE est un serveur utilisant le programme VAST (comparaison des structures 3D des protéines) pour définir les limites des domaines structuraux dans les protéines à partir de leurs coordonnées atomiques. Il fournit aussi pour chaque structure requête une liste de voisins structuraux.

Conditions d'accès

Accès gratuit à http://genome.jouy.inra.fr/domire

Aucun site web renseigné
Visites annuelles :
Non renseignées
Visites uniques :
Non renseignées
Citations :
17
Téléchargements :
Non renseigné

GPCRAutomodel

Description

GPCRAutomodel est un serveur permettant de modéliser des couple de récepteurs de protéines G, protéines largement représentées dans la membrane cellulaire et sont des éléments clés de plusieurs mécanismes de réponse cellulaire aux signaux environnementaux.

Conditions d'accès

Accès gratuit à http://genome.jouy.inra.fr/GPCRAutomodel

Aucun site web renseigné
Visites annuelles :
Non renseignées
Visites uniques :
Non renseignées
Citations :
1 526
Téléchargements :
Non renseigné

VAST

Description

VAST est un programme de comparaison des structures 3D des protéines.

Conditions d'accès

Le logiciel peut-être téléchargé gratuitement sur http://migale.jouy.inra.fr/sites/all/downloads/Migale/Outils/vast.tarbal...

Aucun site web renseigné
Visites annuelles :
Non renseignées
Visites uniques :
Non renseignées
Citations :
29
Téléchargements :
Non renseigné

OSS-HMM

Description

OSS-HMM (Optimal Secondary Structure prediction Hidden Markov Model) est un programme de prédiction de la structure secondaire des protéines selon 3 états : hélice alpha (H), brin bêta (b), et structure apériodique (C) qui utilise le formalisme des modèles de Markov cachés. Quand il est utilisé avec une seule séquence il fournit un Q3 de 68.8%. Avec un alignement multiple il fournit un Q3 de 75.5%. Cet outil peut aussi être utilisé pour générer des séquences de protéines ayant une suite de structures secondaires particulières.

Conditions d'accès

Le logiciel peut-être téléchargé gratuitement sur http://migale.jouy.inra.fr/?q=oss-hmm

Aucun site web renseigné
Visites annuelles :
Non renseignées
Visites uniques :
Non renseignées
Citations :
Non renseigné
Téléchargements :
Non renseigné

ESAP

Description

ESAP est un programme de prédiction de la conformation de boucles dans les protéines. Il est basé sur une technique de Monte-Carlo dans l'espace des angles dièdres.

Conditions d'accès

Le logiciel peut-être téléchargé gratuitement sur http://migale.jouy.inra.fr/sites/all/downloads/Mig/Logiciels/ESAP.versio...

Aucun site web renseigné
Visites annuelles :
Non renseignées
Visites uniques :
Non renseignées
Citations :
59
Téléchargements :
Non renseigné

FROST

Description

FROST (Fold Recognition Oriented Search Tool) est un outil de reconnaissance de repliements.

Conditions d'accès

Accès gratuit à http://genome.jouy.inra.fr/frost/

Aucun site web renseigné
Visites annuelles :
Non renseignées
Visites uniques :
Non renseignées
Citations :
Non renseigné
Téléchargements :
Non renseigné

AnovArray

Description

AnovArray est un ensemble de macros SAS pour l'analyse de données expressionnelles de type microarray et macroarray. Il permet la quantification des variations biologiques et technologiques et la détection de gènes différentiels entre plusieurs conditions. Les méthodes statistiques utilisées sont l'analyse de variance (ANOVA) et la méthode FDR (False Discovery Rate) pour le calcul de probabilités ajustées dans le cadre de test d'hypothèses multiples.

Conditions d'accès

Le logiciel peut-être téléchargé gratuitement sur http://migale.jouy.inra.fr/?q=anovarray

Aucun site web renseigné
Visites annuelles :
Non renseignées
Visites uniques :
Non renseignées
Citations :
Non renseigné
Téléchargements :
Non renseigné

Class2g

Description

Class2g fournit une ségrégation des gènes en deux groupes selon leur expression et donne la probabilité d'appartenir à chaque groupe. Les données peuvent être le ratio de l'expression des gènes dans les deux conditions dans des expériences de microarray, l'intensité du signal de l'expression des gènes dans des expériences de macroarray, ou l'intensité du signal de l'hybridation des gènes dans un contexte de génomique comparative.

Conditions d'accès

Le logiciel peut-être téléchargé gratuitement sur http://migale.jouy.inra.fr/?q=class2g

Aucun site web renseigné
Visites annuelles :
Non renseignées
Visites uniques :
Non renseignées
Citations :
Non renseigné
Téléchargements :
Non renseigné

ISLAND

Description

ISLAND est un programme qui permet de simuler le progrès d'un projet de cartographie physique de génomes par la méthode d'ancrage. Il fournit en particulier le nombre moyen de contigs obtenus, leur longueur moyenne et la proportion moyenne de génome recouverte par les contigs, en fonction de la longueur du génome, des nombres de clones et ancres utilisés et des longueurs de clones.

Conditions d'accès

Le logiciel peut-être téléchargé gratuitement sur http://genome.jouy.inra.fr/ssb/software/island/

Aucun site web renseigné
Visites annuelles :
Non renseignées
Visites uniques :
Non renseignées
Citations :
Non renseigné
Téléchargements :
Non renseigné

MuGeN

Description

MuGeN (Multi-Genome Navigator) est un outil interactif permettant une exploration dans plusieurs génomes annotés complétés par des résultats d'analyse in silico. Il dispose également d'un mode d'exécution en mode batch lui permettant de servir de générateur d'images à divers formats. Ce mode de fonctionnement le prédispose à être intégré à des sites Web pour l'affichage de cartes physiques annotées.

Conditions d'accès

Le logiciel peut-être téléchargé gratuitement sur http://genome.jouy.inra.fr/MuGeN

Aucun site web renseigné
Visites annuelles :
Non renseignées
Visites uniques :
Non renseignées
Citations :
Non renseigné
Téléchargements :
Non renseigné

R'HOM

Description

R'HOM (Recherche de régions HOMogènes dans les séquences d'ADN) est un logiciel dédié à l'utilisation de modèles de chaînes de Markov cachées pour la segmentation de séquences d'ADN en régions homogènes. R'HOM permet d'estimer un modèle de la composition des séquences d'ADN plus réaliste qu'un modèle de chaîne de Markov homogène et ensuite de segmenter les séquences sous ce modèle. Il a été utilisé notamment pour la recherche de transferts horizontaux chez B. subtilis et pour l'estimation de modèles destinés au calcul de la significativité de comptages de mots. R'HOM a été développé en coopération avec le Laboratoire Statistique et Génome d'Evry.

Conditions d'accès

Le logiciel peut-être téléchargé gratuitement sur http://genome.jouy.inra.fr/ssb/rhom

Aucun site web renseigné
Visites annuelles :
Non renseignées
Visites uniques :
Non renseignées
Citations :
Non renseigné
Téléchargements :
Non renseigné

R'MES

Description

R'MES (Recherche de Mots Exceptionnels dans les Séquences d'ADN) est un ensemble de programmes C++ dédié à la recherche de mots (ou familles de mots) ayant une fréquence exceptionnelle dans une séquence donnée (ADN, protéine ou autre). Une visualisation des résultats générés par R'MES peut être obtenue grâce à l'interface graphique RMESPlot disponible sur http://mulcyber.toulouse.inra.fr/projects/rmesplot.

Conditions d'accès

Le logiciel peut-être téléchargé librement sur http://migale.jouy.inra.fr/?q=rmes

Aucun site web renseigné
Visites annuelles :
Non renseignées
Visites uniques :
Non renseignées
Citations :
Non renseigné
Téléchargements :
Non renseigné

SHOW

Description

SHOW (Structured HOmogeneities Watcher) est un "R'HOM" amélioré qui permet de définir souplement un modèle de chaîne de Markov cachée complexe puis d'utiliser ce modèle de diverses manières grâce à l'implémentation d'algorithmes de segmentation (forward-backward, Viterbi), d'estimation (EM) et de simulation. SHOW a essentiellement servi pour prédire les gènes bactériens mais il a aussi été utilisé avec d'autres objectifs comme la détection des sites d'épissage chez l'Homme. SHOW a été développé en collaboration avec le Laboratoire Statistique et Génome d'Evry.

Conditions d'accès

Le logiciel peut-être téléchargé gratuitement sur http://genome.jouy.inra.fr/ssb/SHOW

Domaines d'activité
  • Agro-alimentaire
  • Environnement
  • Biologie
Description des expertises
La plate-forme MIGALE a une interaction privilégiée avec l’équipe StatInfOmics de l ‘unité MaIAGE à qui elle fournit un support logistique important. Les compétences de cette équipe sont les statistiques appliquées à l’analyse des données « omiques », et la bioinformatique au sens large, concernant en particulier :

 

la structure des génomes :

  • traitement et analyse des données NGS
  • l’annotation structurale et fonctionnelle de génomes complets,
  • la recherche de motifs dans les séquences ou les réseaux

la transcriptomique :

  • l’annotation structurale des ANR messagers
  • l’analyse des régulations

la structure et fonction des protéines :

classification et analyse des structures 3D des protéines
modélisation de la structure 3D des protéines

  • analyse des relations structure 3D – fonction des protéines

la génomique évolutive

  • comparaison de génomes microbiens
  • étude des processus évolutifs
  • Les autres équipes de l’unité ont des compétences :
  • en biologie des systèmes
  • biologie des systèmes pour les procaryotes (B. subtilis)
  • modélisation et analyse de réseaux de régulation biologique

en extraction de connaissances à partir de textes scientifiques appliquée

  • à la modélisation des réseaux de régulation génique et du métabolisme,
  • à la relation génotype-phénotype,
  • aux phénotypes multi-espèce et à l’adaptation à l’environnement.
Mots clés:
  • Analyse de données de séquençage NGS
  • Assemblage de génomes et transcriptomes
  • Alignements de lectures sur des génomes
  • Analyse de génomes
  • Annotation structurale et fonctionnelle des génomes
  • Analyse différentielle de l’expression des gènes
  • Métagénomique, métatranscriptomique
  • Analyse de séquences
  • Algorithmique des séquences
  • Alignement (multiple) de séquences
  • Annotation de séquences
  • Recherche de motifs
  • Prédiction d'homologie/orthologie
  • Intégration d'outils
  • Interfaces, portails web
  • Développement de workflows
  • Intégration de données
  • Gestion et transfert de données
  • Bases de données et systèmes d’informations
  • Cluster
  • Génomique comparative
  • Protéomique
  • Analyse de second niveau

Formation professionnelle

Personnes formées :
6 personnes / an
Temps de formation :
1 jour(s) / an
Pas de nouvelle session prévue

Linux

Description

Formation Linux

Conditions d'accès
Non renseigné
Personnes formées :
10 personnes / an
Temps de formation :
1 jour(s) / an
Prochaine session :
14-03-2017

Analyse primaire de données issues de séquenceurs nouvelle génération sous Galaxy

Description
Objectifs

Connaître les concepts et méthodes bioinformatiques utilisés pour l’analyse primaire de données issues de NGS. Application aux outils de mapping et d’assemblage.

Programme

Théorie

•Présentation des différents types de séquenceurs

•Les grandes familles d’algorithmes de mapping de lectures courtes d’assemblage et les outils associés

Pratique

Analyse des données de séquençage d’un génome bactérien

•Contrôle qualité

•Assemblage de-novo

oNettoyage des données

oAssemblage

oVisualisation et statistiques sur l’assemblage

•Comparaison à un génome de référence :

oMapping des lectures sur un génome proche

oVisualisation du mapping 

Conditions d'accès

Ce cycle est ouvert à l'ensemble des agents de l'INRA et aux extérieurs.

Aucun site web renseigné
Personnes formées :
20 personnes / an
Temps de formation :
2 jour(s) / an
Pas de nouvelle session prévue

Traitement des données NGS sous Galaxy

Description

http://migale.jouy.inra.fr/?q=fr/formations

Conditions d'accès

http://migale.jouy.inra.fr/?q=fr/formations

Personnes formées :
7 personnes / an
Temps de formation :
3 jour(s) / an
Prochaine session :
15-05-2017

Annotation de génomes microbiens

Description

Modules en prépartion....

Conditions d'accès

Ce cycle est ouvert à l'ensemble des agents de l'INRA et aux extérieurs.

Aucun site web renseigné
Personnes formées :
Non renseigné
Temps de formation :
Non renseigné
Pas de nouvelle session prévue

Comparaisons de séquences protéiques

Description

http://migale.jouy.inra.fr/?q=fr/formations

Conditions d'accès

http://migale.jouy.inra.fr/?q=fr/formations

Aucun site web renseigné
Personnes formées :
Non renseigné
Temps de formation :
Non renseigné
Pas de nouvelle session prévue
Aucun site web renseigné
Personnes formées :
5 personnes / an
Temps de formation :
2 jour(s) / an
Pas de nouvelle session prévue

Initiation à la phylogénie

Description

http://migale.jouy.inra.fr/?q=fr/formations

Conditions d'accès
Non renseigné
Personnes formées :
7 personnes / an
Temps de formation :
2 jour(s) / an
Prochaine session :
23-03-2017

Modélisation 3D des protéines

Description
Objectifs

Connaître les bases de la modélisation moléculaire : modélisation par homologie, arrimage (docking) de ligands, mutations in silico. Une demi-journée dédiée à la modélisation de vos protéines d'intérêts.

Programme

- Visualiser : Connaître les bases de la visualisation des protéines en 3D avec PYmol.

- Comprendre : Analyse des structures 3D de protéines (RX ou RMN). Recherche d'homologues avec HHpred, I-Tasser, etc... Modélisation par homologie avec Modeller, Phyre2. Principes et applications.

- Prédire : Docking de ligands avec Autodock. Prédiction des mutations in silico. Principes et applications.

  • L'accent sera mis sur les points forts et les limites des différents outils et la pratique avec de nombreux "hand- on tutorials"
  • Plus une session dédiée : «bring your own protein».
Conditions d'accès

Ce cycle est ouvert à l'ensemble des agents de l'INRA et aux extérieurs.

Personnes formées :
Non renseigné
Temps de formation :
Non renseigné
Prochaine session :
09-05-2017

Initiation à Perl

Description
Objectifs

Initiation à la programmation.

Identifier les possibilités offertes par l’écriture de quelques lignes de code.

Réalisation de tâches simples d’extraction et de reformatage d’informations issues de fichiers texte.

 

 

Programme

- Présentation de PERL

- Variables PERL

- Structures de contrôle

- Gestion de fichiers

- Réalisation de programmes simples

 

Illustration avec des exercices de manipulation de fichiers de séquences et de fichiers de résultats d’outils bioinformatiques. 

 

Conditions d'accès

Ce cycle est ouvert à l'ensemble des agents de l'INRA et aux extérieurs.

Personnes formées :
Non renseigné
Temps de formation :
Non renseigné
Prochaine session :
11-05-2017

Perl avancé

Description
Objectifs

Aller plus loin avec Perl afin d’être autonome pour des manipulations complexes visant à extraire et reformater des données issues de fichiers texte.

 

 

 

 

Programme

- Expressions régulières

- Fonctions

- Prise en main de Bioperl

 

 

Illustration avec des exercices de manipulation de fichiers de séquences et de fichiers de résultats d’outils bionformatiques.

 

Conditions d'accès

Ce cycle est ouvert à l'ensemble des agents de l'INRA et aux extérieurs.

Personnes formées :
6 personnes / an
Temps de formation :
2 jour(s) / an
Prochaine session :
07-03-2017

Initiation à R

Description
Objectifs

- Présenter le langage de programmation R et ses principes.

- Utiliser les principales fonctionnalités de ce langage pour effectuer des calculs mathématiques, statistiques ou des représentations graphiques.

- Attention : ce module n'est ni un module de statistique, ni un module d'analyse statistique des données.

Programme

- Structures et manipulation de données.

- Principaux éléments du langage de programmation (boucle, fonctions…).

- Différentes représentations graphiques de données/résultats (plot, histogramme, boxplot).

Conditions d'accès

Ce cycle est ouvert à l'ensemble des agents de l'INRA et aux extérieurs.

Personnes formées :
8 personnes / an
Temps de formation :
2 jour(s) / an
Prochaine session :
08-03-2017

Initiation à Python

Description
Objectifs

Initiation à la programmation.

Réalisation de tâches simples d'extractions d'informations.

Identifier les possibilités offertes par l'écriture de quelques lignes de codes.

 

 

 

 

 

Programme

• Présentation de Python

• Variables Python

• Structures de contrôle

• Réalisation de programmes simples

• Gestion de fichiers

• Fonctions

Illustration avec des exercices de manipulation de fichiers de séquences

Conditions d'accès

Ce cycle est ouvert à l'ensemble des agents de l'INRA et aux extérieurs.

Personnes formées :
8 personnes / an
Temps de formation :
1 jour(s) / an
Prochaine session :
10-03-2017

Python avancé

Description
Objectifs

Etre autonome pour des manipulations simples visant à extraire, reformater des données issues de fichiers texte.

 

 

 

 

 

Programme

- Expressions régulières

- Gestion des erreurs

- Biopython

- Réalisation de programmes simples

Conditions d'accès

Ce cycle est ouvert à l'ensemble des agents de l'INRA et aux extérieurs.

Aucun site web renseigné
Personnes formées :
Non renseigné
Temps de formation :
Non renseigné
Pas de nouvelle session prévue
Personnes formées :
Non renseigné
Temps de formation :
Non renseigné
Prochaine session :
03-05-2017

Traitements bioinfo RNA-seq

Description
Objectifs

Connaitre les concepts et méthodes bioinformatiques utilisées pour l’analyse de données RNA-Seq eucaryote et procaryote.

 

Programme

Théorie

  • Bases biologiques des études d’expression
  • Séquençage NGS et RNA-Seq, présentation des différents types de séquenceurs
  • Méthodes d’alignements spécifiques au RNA-Seq
  • Reconstruction de transcrits
  • Assemblage de novo de transcriptomes
  • Quantification

 

Pratique

  • TP sur des données de type euraryote
  • Contrôle qualité
  • Nettoyage des données
  • Alignement sur un génome de référence et épissage
  • Visualisation de l’alignement
  • Découverte de nouveaux transcrits
  • Obtention d’un tableau de comptage

 

Lien avec d'autres modules

L'analyse statistique des résultats du type d’analyses bioinformatiques effectuées dans ce module est traitée dans le module 16 [Stats & RNA-seq.

Conditions d'accès

Ce cycle est ouvert à l'ensemble des agents de l'INRA et aux extérieurs.

Personnes formées :
9 personnes / an
Temps de formation :
2 jour(s) / an
Prochaine session :
16-03-2017

Analyse statistique RNA-seq sous Galaxy

Description
Objectifs

Se sensibiliser aux concepts et méthodes statistiques pour l'analyse de données transcriptomiques de type RNA-Seq.

Comprendre le matériel et méthodes (normalisation et tests statistiques) d'un article

du domaine.

Comprendre les particularités liées à la nature des données.

 

 

Programme

Planification expérimentale des expériences RNA-Seq (identification des biais, répétitions, biais contrôlables).

Normalisation et analyse différentielle : recherche de "régions d'intérêt" différentiellement exprimées (modèle linéaire généralisé).

Prise en compte de la multiplicité des tests.

Le cours sera illustré par différents exemples et un jeu de données sera traité à l'aide du package R SARTools (basé sur les packages R DESeq2 et edgeR) dans les environnements Galaxy et RStudio.

Conditions d'accès

Ce cycle est ouvert à l'ensemble des agents de l'INRA et aux extérieurs.

Personnes formées :
22 personnes / an
Temps de formation :
3 jour(s) / an
Prochaine session :
27-03-2017

Analyse de données métagénomiques 16S

Description
Objectifs

Cette formation est dédiée à l'analyse de données de type "métagénomique amplicon" issues des technolo-gies de séquençage 454 et Illumina. La formation couvre les grandes étapes d'un pipeline d'analyse bioinformatique sous Galaxy (FROGS) pour transformer les séquences en tables d'abondances puis présente des outils statistiques sous R (phyloseq) qui permettent de décrire et comparer les échantillons à partir de ces tables.

 

Programme

Jours 1 et 2 : Analyses Bioinformatiques sous Galaxy

  • Introduction générale
  • Brefs rappels sur l'environnement Galaxy
  • Présentation des données issues des différentes technologies de séquençage
  • Prétraitement des données
  • Clustering des séquences, construction des OTUs
  • Détection de chimères
  • Annotation taxonomique
  • Filtrage des données de comptages
  • Outils de visualisation
  • Construction de workflow et configuration de FROGS
  • Limite des données et des méthodes 

Jour 3 et 4 :  Analyses Statistiques sous Rstudio

  • Introduction générale
  • Import, manipulation et visualisation des données
  • Mesure de diversités : Unifrac, Bray-Curtis, etc.
  • Ordination et réduction de dimension : MDS
  • Clustering et Heatmap
  • Comparaison d'échantillons : PERMANOVA, adonis

▫ Introduction générale
▫ Brefs rappels sur l'environnement Galaxy
▫ Présentation des données issues des différentes technologies de séquençage ▫ Prétraitement des données
▫ Clustering des séquences, construction des OTUs
▫ Détection de chimères
▫ Annotation taxonomique
▫ Filtrage des données de comptages
▫ Outils de visualisation
▫ Construction de workflow et configuration de FROGS
▫ Limite des données et des méthodes

page1image9968page1image10128

Jour 3 : Analyses Statistiques sous Rstudio
  • ▫  Introduction générale
  • ▫  Import et manipulation des données
  • ▫  Mesure de diversités : Unifrac, Bray-Curtis, etc.
  • ▫  Ordination et réduction de dimension : MDS
  • ▫  Clustering et Heatmap
  • ▫  Comparaison d'échantillons : PERMANOVA, adonis 
Conditions d'accès

Ce cycle est ouvert à l'ensemble des agents de l'INRA et aux extérieurs.

Répartition des utilisateurs
Internationaux
1 %
Nationaux
37 %
Régionaux
15 %
Locaux
47%
Description de la répartition :
Non renseigné
Projets propres de la plateforme
(1)

MOBYLENET (2009-2011), Réseau de portails Web

Collaborations
Projets d'ANR
Projet PIA France Génomique (2012-20120) WP2.2 : évaluation des algorithmes d ‘alignement de lectures.

EXECO (2010-2013), Etude méta-transcriptomique et biochimique de l’écosystème fromager: pour un contrôle accru de l’EXpression d’un ECOsystème alimentaire complexe.


GEMO (2010-2013), Génomique Evolutive de Magnaporthe Oryzae


BIOWIC (2009-2012), Bioinformatics Workflows for Intensive Computation

CBME (2009-2012), Computational Biology for Metagenomics Experiments

MEETAC (2009-2013), Valorisation des données transcriptomiques bovines à l'interface mère-embryon pour une compréhension intégrée de l'implantation



SURFING (2010-2013), Starter surface against inflammation of the gut


ECOSTAB (2012-2014), stability and functional redundancy of a microbial ecosystem


METASOIL (2009-2012), Description et exploitation de la communauté microbienne du sol par une approche métagénomique


Projets européens et internationaux

BOND, FP7, Bioelectronic Olfactory Neuron Device, (2009-2012)

Projets avec des industriels

Projet PIA (BPI) Biodatacloud (2013-2016) développement d’un outil de visualisation multigénotype pour des génomes de plante Coordinateur Biogemma.

Projets de collaboration non financés par un organisme extérieur
Non renseigné
Prestations de service non financés par un organisme extérieur
Non renseigné
Animations
Publications internes
F. Samson, R. Shrager, C.-H. Tai, V. Sam, B.-K. Lee, P. Munson, J.-F. Gibrat, and J. Garnier. DOMIRE: a web server for identifying structural domains and their neighbors in proteins. Bioinformatics , 28(7):1040–1041, 2012

Schbath S., Martin V., M. Zytnicki, Fayolle J., Loux V., and Gibrat J.-F. Mapping reads on a genomic sequence: an algorithmic overview and a practical comparative analysis. J. Computational Biology , 19(6):796–813, 2012.
Publications externes
S. Weiss, F. Samson, D. Navarro, and S. Casaregola. YeastIP: a database for identification and phylogeny of Saccharomycotina yeasts. FEMS Yeast Research , 13(1):117–125, 2012.

M. Amari, S. Laguerre, M. Vuillemin, H. Robert, V. Loux, C. Klopp, S. Morel, B. Gabriel, M. Remaud-Siméon, V. Gabriel, C. Moulis, and C. Fontagné-Faucher. Genome Sequence of Weissella confusa LBAE C39-2, Isolated from a Wheat Sourdough. J. Bacteriology , 194(6):1608–1609, 2012.

P. Barbier, A. Houel, V. Loux, J. Poulain, J.-F. Bernardet, M. Touchon, and E. Duchaud. Complete genome sequence of Flavobacterium indicum GPSTA100-9T , isolated from warm spring water. J. Bacteriology, 194(11):3024–3025, 2012.

S. Cousin, L. Ma, S. Creno, D. Clermont, V. Loux, C. Bizet, and C. Bouchier. Draft genome sequence of Lactobacillus gigeriorum CRBIP 24.85T , isolated from a chicken crop. J. Bacteriology , 194(21):5973, 2012.

M. Dalmasso, J. Aubert, S. Even, H. Falentin, M.-B. Maillard, S. Parayre, V. Loux, J. Tanskanen, and A. Thierry. Accumulation of intracellular glycogen and trehalose by Propionibacterium freudenreichii under conditions mimicking cheese ripening in the cold. Applied & Environmental Microbiology , 78(17):6357–6364, 2012.

O. Grépinet, Z. Boumart, I. Virlogeux-Payant, V. Loux, H. Chiapello, A. Gendrault, J.-F. Gibrat, M. Chemaly, and P. Velge. Genome sequence of the persistent Salmonella enterica subsp. Enterica serotype Senftenberg strain SS209. J. Bacteriology , 194(9):2385–2386, 2012.

O. Grépinet, A. Rossignol, V. Loux, H. Chiapello, A. Gendrault, J.-F. Gibrat, P. Velge, and I. Virlogeux-Payant. Genome sequence of the invasive Salmonella enterica subsp. enterica serotype Enteritidis strain LA5. J. Bacteriology , 194(9):2387–2388, 2012.

F. Irlinger, V. Loux, P. Bento, J.-F. Gibrat, C. Straub, P. Bonnarme, S. Landaud, and C. Monnet. Genome sequence of Staphylococcus equorum subsp. equorum Mu2, isolated from a french smear-ripened cheese. J. Bacteriology , 194(18):5141–5142, 2012.

S. Laguerre, M. Amari, M. Vuillemin, H. Robert, V. Loux, C. Klopp, S. Morel, B. Gabriel, M. Remaud-Siméon, V. Gabriel, C. Moulis, and C. Fontagné-Faucher. Genome sequences of three Leuconostoc citreum strains, LBAE C10, LBAE C11, and LBAE E16, isolated from wheat sourdoughs. J. Bacteriology ,194(6):1610–1611, 2012.

V. Meslier, V. Loux, and P. Renault. Genome sequence of Lactococcus raffinolactis strain 4877, isolated from natural dairy starter culture. J. Bacteriology , 194(22):6364, 2012.

C. Monnet, Loux V., Bento P., Gibrat J.-F., C. Straub, P. Bonnarme, S. Landaud, and F. Irlinger. Genome sequence of Corynebacterium casei UCMA 3821, isolated from a smear-ripened cheese. J. Bacteriology , 194(3):738–739, 2012

C. Cailliez-Grimal, S. Chaillou, J. Anba-Mondoloni, Loux V., M.I. Afzal, A. Rahman, G. Kergourlay, M.-C. Champomier-Vergès, M. Zagorec, P. Dalgaard, J.J. Leisner, H. Prévost, A.-M. Revol-Junelles, and F. Borges. Complete chromosome sequence of Carnobacterium maltaromaticum LMA 28. Genome Announcements , 1(1):e00115–12, 2013.

S. Cousin, D. Clermont, S. Creno, L. Ma, Loux V., C. Bizet, and C. Bouchier. Draft genome sequence of Lactobacillus pasteurii CRBIP 24.76T . Genome Announcements , 1(4):e00660–13, 2013.

S. Cousin, S. Creno, L. Ma, D. Clermont, Loux V., C. Bizet, and C. Bouchier. Draft genome gequence of Lactobacillus hominis strain CRBIP 24.179T , isolated from human intestine. Genome Announcements , 1(4):e00662–13, 2013.

S. Cousin, Loux V., L. Ma, S. Creno, D. Clermont, C. Bizet, and C. Bouchier. Draft genome sequences of Lactobacillus equicursoris CIP 110162T and Lactobacillus sp. CRBIP 24.137 isolated from thoroughbred racehorse feces and urine of human respectively. Genome Announcements, 1(4):e00663–13, 2013.

H. Falentin, S. Cousin, D. Clermont, S. Creno, L. Ma, L. Chuat, Loux V., P. Rüdiger, C. Bizet, and C. Bouchier. Draft genome sequence of five strains of Lactobacillus acidophilus : strain CIP 76.13T , isolated from human, strains CIRM 442 and CIRM 445 isolated from dairy products, and strains DSM 20242 and DSM 9126 of unknown origin. Genome Announcements, 1(4):e00658–13, 2013.
Publications avec le laboratoire d'hébergement
G. Aguileta, J. Lengelle, H. Chiapello, T. Giraud, M. Viaud, E. Fournier, F. Rodolphe, S. Marthey, Ducasse, A. Gendrault-Jacquemard, J. Poulain, P. Wincker, and L. Gout. Genes under positive selection in a model plant pathogenic fungus, Botrytis . Infection, Genetics & Evolution, 12(15):987–996, 2012

A.F. Movaghar, G. Launay, S. Schbath, J.-F. Gibrat, and F. Rodolphe. Statistical significance of threading scores. J. Computational Biology , 19(1):13–29, 2012.

G. Launay, S. Téletchéa, F. Wade, E. Pajot-Augy, J.-F. Gibrat, and G. Sanz. Automatic modeling of mammalian olfactory receptors and docking of odorants. Protein Engineering Design & Selection, 25(8):377–386, 2012.

E. Fujiwara-Nagata, C. Chantry-Darmon, J.-F. Bernardet, M. Eguchi, E. Duchaud, and Nicolas P. Population structure of the fish pathogen Flavobacterium psychrophilum  at whole-country and model river levels in Japan. Veterinary Research , 44(1):34, 2013.

G. Launay, G. Sanz, E. Pajot-Augy, and J.-F. Gibrat. Modeling of mammalian olfactory receptors and docking of odorants. Biophysical Reviews , 4(3):255–269, 2012.

J.-F. Gibrat, M. Mariadassou, P. Boudinot, and B. Delmas. Analyses of the radiation of birnaviruses from diverse host phyla and of their evolutionary affinities with other double-stranded RNA and positive strand RNA viruses using robust structure-based multiple sequence alignments and advanced phylogenetic methods. BMC Evolutionary Biology , 13:154, 2013.

T. Lacroix ; V. Loux ; A. Gendrault-Jacquemard ; M. Hoebeke ; J-F Gibrat. Insyght: navigating amongst abundant homologues, syntenies and gene functional annotations in bacteria, it's that symbol! Nucleic acids research, 42, 1-9, 2014
cea
cnrs
inra
inria
inserm
logo_elixir
logo-investissements