bilille

Adress
Batiment M3, Faculté des Sciences et Technologies, Université de Lille
Pôle recherche de la faculté de médecine, Université de Lille 59000 Lille
Structure(s)
CNRS
Unit:
Université de Lille, CNRS, INSERM, Institut Pasteur de Lille, Inria, CHRU Lille
[field_pole_regional_de_rattachem]
Website
bilille
Scientific leader(s)
Technical leader(s)
Technical leader
Not documented
Certificat(s)
  • France-Génomique
Annual visits:
36 000 an
Unique visits:
3 600 an
Quotes:
247
Latest update:
03-12-2018

Norine

Description

Norine is a public computational resource with a web interface and REST access to a knowledge-base of
nonribosomal peptides. It also contains dedicated tools : 2D graph viewer and editor, comparison of NRPs,
MyNorine, a tool allowing anybody to easly submit new nonribosomal peptides, Smiles2monomers (s2m), a
tool that deciphers the monomeric structure of polymers from their chemical structure.

Access conditions

Accès libre et gratuit depuis le site web de la resource Norine.

Annual visits:
Not documented
Unique visits:
Not documented
Quotes:
57
Downloads:
100

CRAC

Description

Méthode d'analyse de données RNA-seq.

Access conditions

Gratuit via le site de la plateforme.

Annual visits:
Not documented
Unique visits:
Not documented
Quotes:
25
Downloads:
Not documented

Vidjil

Description

Objectif

Vidjil est une plate-forme logicielle open-source dédiée à l'analyse de données de séquençage haut-débit issues de lymphocytes. Les recombinaisons V(D)J dans les lymphocytes sont essentielles pour la diversité immunologique. Ils sont aussi des marqueurs utiles de pathologies et, pour la leucémie, ils sont utilisés pour quantifier le minimum résiduel de la maladie pendant la phase de rémission du patient. Le séquençage Haut-Débit (NGS/HTS) permet maintenant le séquençage exhaustif des populations lymphoïques avec des méthodes dédiées de Rep-Seq et les logiciels associés.

Description de l'outil

Vidjil est constitué de 3 parties : un algorithme, un visualisateur et un serveur qui permettent l'analyse de populations lymphocitaires qui contiennent des recombinaisons V(D)J.

L'algorithme haut-débit de Vidjil extrait les jonctions V(D)J et les regroupe en clones. Cette analyse est basée sur une heuristique à base de graine espacées et est rapide et évolutive, puisque, dans la première phase, aucun alignement n'est réalisé sur les séquences initiales de la base de données. Chaque séquence est assignée à un cluster selon sa jonction V(D)J. Puis, une séquence représentative de chaque cluster est calculée en un temps linéaire par rapport à la taille du cluster. Pour finir, nous réalisons un alignement complet par programmation dynamique de cette séquence représentative contre les séquences initiales.

Vidjil contient également un navigateur dynamique (en D3JS) pour visualiser et analiser les clones et leur évolution au cours du temps.

Access conditions

Vidjil est open-source, sous la licence GNU GPLv3 (code disponible sur GitHub). Le browser peut-être utilisé via le web et une version en ligne de commande peut-être téléchargée (cf. page d'accueil).

Annual visits:
Not documented
Unique visits:
Not documented
Quotes:
507
Downloads:
Not documented

SortMeRNA

Description

Objectif

SortMeRNA est un outil d'analyse de séquences biologiques pour le filtrage de données méta-transcriptomiques et méta-génomiques, le mapping et la sélection d'OTU (unité taxonomique opérationnelle). La principale application de SortMeRNA est le filtrage et le mapping d'ARN ribosomiques à partir de données NGS.

Description de l'outil

L'algorithme principal est basé sur des graines approchées, ainsi qu'une structure d'indexation de texte optimisée. Il permet des analyses rapides et sensibles de séquences nucléiques.

SortMeRNA prend en entrée un fichier de reads (au format fasta ou fastq) et un ou plusieurs fichier(s) de base(s) de données d'ARNr. Il en extrait les ARNr et les reads refusésdans 2 fichiers. Sur demande, il peut fournir des alignements locaux de haute qualité des reads d'ARNr contre les ARNr des bases de données. SortMeRNA fonctionne avec des données Illumina, 454, Ion Torrent et PacBio et produit en sortie des alignements de type SAM ou Blast. Il est implémenté en C++.

Access conditions

SortMeRNA est distribué gratuitement sous licence LGPL.

Annual visits:
Not documented
Unique visits:
Not documented
Quotes:
93
Downloads:
Not documented

Carnac

Description

Carnac est un logiciel d'analyse de structures secondaires d'une famille d'ARN homologues. Il permet de prédire si les séquences partagent réellement une structure secondaire commune. Lorsque cette structure existe, Carnac est capable de détecter une grande partie des tiges. L'entrée du programme est un ensemble de séquences d'ARN simple brin non alignées. La stratégie de repliement s'appuie sur un modèle thermodynamique qui minimise l'énergie. Elle associe l'information provenant des conservations locales de la structure primaire avec celle des covariations entre séquences.

Access conditions

Carnac peut être utilisé via une interface web ou être téléchargé pour être installé localement (un compilateur C est nécessaire). Une version exécutable sous Windows est également disponible.

Annual visits:
Not documented
Unique visits:
Not documented
Quotes:
76
Downloads:
Not documented

DiNAMO

Description

The DiNAMO software implements an exhaustive algorithm to detect over-represented IUPAC motifs in a set of DNA sequences. It has two modes: scanning mode, where all windows are parsed, or fixed-position mode, where only motifs occurring at a specific position in the sequences are taken into account.

DiNAMO can be used in a variety of applications, such as ChIP-seq peak analysis for transcription factor binding sites identification, or finding motifs that induce systematic sequencing errors.

Access conditions

Aucune

Domains of activity
  • Computer Science
  • Biology
  • Biomedical
  • Environment
Keywords:
  • Analyse de données de séquençage NGS
  • Méthodologie
  • Assemblage de génomes et transcriptomes
  • Alignements de lectures sur des génomes
  • Génomique (DNA-seq)
  • Analyse de génomes
  • Annotation structurale et fonctionnelle des génomes
  • Transcriptomique (RNA-seq)
  • Analyse différentielle de l’expression des gènes
  • Analyses de transcrits et transcrits variants
  • Analyse de variants
  • Panels (amplicons, captures)
  • Exomes
  • Analyse de la régulation de l’expression des gènes
  • Chip-seq
  • Petits et longs ARN non-codants
  • Métagénomique, métatranscriptomique
  • Analyse de séquences
  • Algorithmique des séquences
  • Alignement (multiple) de séquences
  • Annotation de séquences
  • Recherche de motifs
  • Bioinformatique structurale
  • Biostatistiques
  • Statistique descriptive
  • Tests statistiques
  • Régression
  • Analyses multivariées
  • Réduction de dimension
  • Développements technologiques de l‘Information et de la Communication
  • Outils
  • Intégration d'outils
  • Interopérabilité
  • Interfaces, portails web
  • Développement de workflows
  • Données
  • Intégration de données
  • Gestion et transfert de données
  • Bases de données et systèmes d’informations
  • Evolution et phylogénie
  • Evolution moléculaire
  • Gènes et génomes
  • Génomique comparative
  • Comparaison des génomes
  • Génomique : Puces
  • Biopuces ADN
  • CGH
  • Biopuces ARN
  • Expression
  • Immunogénétique
  • Analyse de répertoires immunitaires
  • Immunoinformatique
  • Protéomique
  • Analyse différentielle statistique

Formation professionnelle

Trainees:
12 trainees / year
Training time:
2 day(s) / year
Upcoming session :
07-03-2019

Cycle « Analyse de données de séquençage à haut-débit » - Module 1/5 : Analyses ADN

Description

bilille propose chaque année un cycle de formation d'introduction à l'analyse des données de séquençage à haut débit.

Ce cycle est composé de 5 modules, à la carte : 

- Module 1: Analyses ADN

- Module 2: Analyses de variants

- Module 3: Analyses RNA-seq, bioinformatique

- Module 4: Analyses RNA-seq, biostatistique

- Module 5: Métagénomique

Les fiches descriptives sont accessibles sur le site de bilille. Chaque module comprend des présentations générales et des séances pratiques sur ordinateur, avec Galaxy.

Les objectifs du module 1 sont :

- Apprendre à manipuler des données de séquençage d’ADN
- Réaliser des contrôles de qualité et du nettoyage des lectures
- Présenter les méthodes et outils d'alignement
- Réaliser des contrôles de qualité et des alignements sur une référence
- Introduction à l’assemblage des lectures sans référence
- Utiliser la plateforme Galaxy pour ces analyses

Contacts: Guillaume Brysbaert, Ségolène Caboche, Sylvain Legrand (mails)

Access conditions

Etre familier avec la plate-forme web Galaxy (idéalement avoir suivi la formation bilille « Initiation à Galaxy »)

Trainees:
12 trainees / year
Training time:
3 day(s) / year
Upcoming session :
01-04-2019

Cycle « Analyse de données de séquençage à haut-débit » - Module 2/5 : Analyses de variants

Description

bilille propose chaque année un cycle de formation d'introduction à l'analyse des données de séquençage à haut débit.

Ce cycle est composé de 5 modules, à la carte : 

- Module 1: Analyses ADN

- Module 2: Analyses de variants

- Module 3: Analyses RNA-seq, bioinformatique

- Module 4: Analyses RNA-seq, biostatistique

- Module 5: Métagénomique

Les fiches descriptives sont accessibles sur le site de bilille. Chaque module comprend des présentations générales et des séances pratiques sur ordinateur, avec Galaxy.

Les objectifs du module 2 sont :

- Comprendre les grands principes de la détection de variants
- Réaliser les différentes étapes du post-traitement des données d’alignement à la détection de variants
- Adapter l’analyse en fonction du type de données NGS générées
- Comprendre la structure des données de variants
- Savoir annoter des variants
- Etre capable d’interpréter une liste de variants grâce aux outils libres disponibles

Contacts: Guillaume Brysbaert, Ségolène Caboche, Sylvain Legrand (mails)

Access conditions

- Etre familier avec la plate-forme web Galaxy (idéalement avoir suivi la formation bilille « Initiation à Galaxy »)
- Avoir suivi le module 1/5 « Analyses ADN » de ce cycle ou toute autre formation permettant de justifier de connaissances sur les données de séquençage haut débit et leur alignement

Trainees:
12 trainees / year
Training time:
2 day(s) / year
Upcoming session :
13-06-2019

Cycle « Analyse de données de séquençage à haut-débit » - Module 3/5 : Analyses RNA-seq - partie 1 (bioinformatique)

Description

bilille propose chaque année un cycle de formation d'introduction à l'analyse des données de séquençage à haut débit.

Ce cycle est composé de 5 modules, à la carte : 

- Module 1: Analyses ADN

- Module 2: Analyses de variants

- Module 3: Analyses RNA-seq, bioinformatique

- Module 4: Analyses RNA-seq, biostatistique

- Module 5: Métagénomique

Les fiches descriptives sont accessibles sur le site de bilille. Chaque module comprend des présentations générales et des séances pratiques sur ordinateur, avec Galaxy.

Les objectifs du module 3 sont :

- Savoir réaliser une analyse transcriptomique par RNA-seq avec ou sans (de novo) génome de référence à l’aide du portail Galaxy
- Avoir un regard critique sur la qualité des lectures obtenues par le séquenceur
- Connaître et savoir paramétrer les outils nécessaires à l’analyse

Contacts: Guillaume Brysbaert, Ségolène Caboche, Sylvain Legrand (mails)

Access conditions

Etre familier avec la plate-forme web Galaxy (idéalement avoir suivi la formation bilille « Initiation à Galaxy »)

Avoir suivi le module 1/5 « Analyses ADN » de ce cycle ou toute autre formation permettant de justifier de connaissances sur les données de séquençage haut débit et leur alignement.

Trainees:
12 trainees / year
Training time:
2 day(s) / year
Upcoming session :
16-09-2019

Cycle « Analyse de données de séquençage à haut-débit » - Module 4/5 : Analyses RNA-seq - partie 2 (biostatistique)

Description

bilille propose chaque année un cycle de formation d'introduction à l'analyse des données de séquençage à haut débit.

Ce cycle est composé de 5 modules, à la carte : 

- Module 1: Analyses ADN

- Module 2: Analyses de variants

- Module 3: Analyses RNA-seq, bioinformatique

- Module 4: Analyses RNA-seq, biostatistique

- Module 5: Métagénomique

Les fiches descriptives sont accessibles sur le site de bilille. Chaque module comprend des présentations générales et des séances pratiques sur ordinateur, avec Galaxy.

Les objectifs du module 4 sont :

- Savoir réaliser une analyse différentielle de données RNA-seq à partir d’une table de comptage (quantifiant les lectures alignées) à l’aide du portail Galaxy

- Avoir un regard critique sur les résultats d’une analyse différentielle

- Comprendre différentes méthodes de normalisation et les contextes d’utilisation correspondants

Contacts: Guillaume Brysbaert, Ségolène Caboche, Sylvain Legrand (mails)

Access conditions

- Etre familier avec la plate-forme web Galaxy (idéalement avoir suivi la formation bilille « Initiation à Galaxy »)
- Avoir suivi le module 2/5 «Analyses RNA-seq–partie 1 (bioinformatique)» de ce cycle ou toute autre formation permettant de justifier de connaissances sur les données de séquençage haut débit et la façon d’obtenir une table de comptage

Trainees:
12 trainees / year
Training time:
3 day(s) / year
Upcoming session :
20-11-2019

Cycle « Analyse de données de séquençage à haut-débit » - Module 5/5 : Métagénomique

Description

bilille propose chaque année un cycle de formation d'introduction à l'analyse des données de séquençage à haut débit.

Ce cycle est composé de 5 modules, à la carte : 

- Module 1: Analyses ADN

- Module 2: Analyses de variants

- Module 3: Analyses RNA-seq, bioinformatique

- Module 4: Analyses RNA-seq, biostatistique

- Module 5: Métagénomique

Les fiches descriptives sont accessibles sur le site de bilille. Chaque module comprend des présentations générales et des séances pratiques sur ordinateur, avec Galaxy.

Les objectifs du module 5 sont :

- Connaître les différentes méthodes de séquençage à haut débit pour la métagénomique, avec leurs avantages et leurs limites : métagénomique ciblée, métagénomique génomes entiers, métatranscriptomique
- Comprendre les différentes étapes analytiques du traitement bioinformatique des données et savoir les mettre en œuvre
- Savoir conduire une analyse statistique pour l’estimation de la richesse de la biodiversité
- Aller jusqu’aux conclusions biologiques

Contacts: Guillaume Brysbaert, Ségolène Caboche, Sylvain Legrand (mails)

Access conditions

- Etre familier avec la plate-forme web Galaxy (idéalement avoir suivi la formation bilille « Initiation à Galaxy »)
- Avoir suivi le module 1/5 « Analyses ADN » de ce cycle ou toute autre formation permettant de justifier de connaissances sur les données de séquençage haut débit et leur alignement. Etre familier avec le vocabulaire et les étapes de base de l’analyse de données de séquençage : nettoyage, assemblage, mapping

Trainees:
12 trainees / year
Training time:
2 day(s) / year
No upcoming session scheduled

Cycle « Initiation à la bioinformatique » - Module 1/4 : Banques de données et Blast

Description

bilille propose un cycle de découverte de la bioinformatique à destination des chercheurs, enseignants-chercheurs, ingénieurs, techniciens et doctorants en biologie. Aucun pré-requis en informatique n'est attendu.

Le cycle est constitué de quatre modules de deux jours:

- Banques de données et BLAST
- Alignement de séquences
- Prédiction de gènes et annotation de protéines
- Initiation à la reconstruction phylogénétique en biologie moléculaire

Ces modules peuvent être suivis indépendamment, mais ont une cohérence. Suivre chaque module peut aider à une meilleure compréhension des modules suivants.

Les fiches descriptives des différents modules sont accessibles sur le site web de bilille.

Les objectifs du module 1 sont :

- Découvrir différentes banques de données de séquences généralistes
- Savoir interroger les banques de données et réaliser des requêtes pertinentes
- Comprendre la structure des données
- Savoir utiliser de manière optimale le logiciel Blast en fonction de l'application visée (ex : recherche d’homologie, prédiction de gènes…)
- Etre capable d'analyser un résultat avec un regard critique

Contacts: Guillaume Brysbaert, Ségolène Caboche, Sylvain Legrand (mails)

Access conditions

Savoir utiliser un ordinateur (Windows...) : naviguer sur internet (Internet Explorer ou Firefox), utiliser un traitement de texte (Word ou OpenOffice).

Trainees:
12 trainees / year
Training time:
2 day(s) / year
No upcoming session scheduled

Cycle « Initiation à la bioinformatique » - Module 2/4 : Alignement de séquences

Description

bilille propose un cycle de découverte de la bioinformatique à destination des chercheurs, enseignants-chercheurs, ingénieurs, techniciens et doctorants en biologie. Aucun pré-requis en informatique n'est attendu.

Le cycle est constitué de quatre modules de deux jours:

- Banques de données et BLAST
- Alignement de séquences
- Prédiction de gènes et annotation de protéines
- Initiation à la reconstruction phylogénétique en biologie moléculaire

Ces modules peuvent être suivis indépendamment, mais ont une cohérence. Suivre chaque module peut aider à une meilleure compréhension des modules suivants.

Les fiches descriptives des différents modules sont accessibles sur le site web de bilille.

Les objectifs du module 2 sont :

- Découvrir les différents types d'alignement pour les séquences protéiques et nucléiques
- Savoir choisir le logiciel et les paramètres adaptés à une problématique (alignement local, global, multiple...)
- Comprendre les méthodes algorithmiques pour l'alignement de séquences
- Comprendre les paramètres des logiciels
- Etre capable d'analyser un résultat d'alignement avec un regard critique

Contacts: Guillaume Brysbaert, Ségolène Caboche, Sylvain Legrand (mails)

Access conditions

- Savoir utiliser un ordinateur (Windows…) : naviguer sur internet (Internet Explorer ou Firefox), utiliser un traitement de texte (Word ou OpenOffice).
- Etre familier avec les banques de données, Blast et formats de séquences (idéalement avoir suivi le module 1/4 « Banques de données et Blast » du cycle d'initiation à la bioinformatique).

Trainees:
12 trainees / year
Training time:
2 day(s) / year
No upcoming session scheduled

Cycle « Initiation à la bioinformatique » - Module 3/4 : Prédiction de gènes et annotation de protéines

Description

bilille propose un cycle de découverte de la bioinformatique à destination des chercheurs, enseignants-chercheurs, ingénieurs, techniciens et doctorants en biologie. Aucun pré-requis en informatique n'est attendu.

Le cycle est constitué de quatre modules de deux jours:

- Banques de données et BLAST
- Alignement de séquences
- Prédiction de gènes et annotation de protéines
- Initiation à la reconstruction phylogénétique en biologie moléculaire

Ces modules peuvent être suivis indépendamment, mais ont une cohérence. Suivre chaque module peut aider à une meilleure compréhension des modules suivants.

Les fiches descriptives des différents modules sont accessibles sur le site web de bilille.

Les objectifs du module 3 sont :

- découvrir les logiciels liés à la prédiction de gènes et à l'annotation de protéines
- acquérir la méthodologie pour prédire les gènes présents sur un génome qu'il soit bactérien ou eucaryote
- acquérir la méthodologie pour analyser la séquence protéique prédite et en déduire la fonction possible de la protéine, avoir une idée de sa localisation cellulaire et de sa structure
- être capable d'analyser les résultats obtenus par les logiciels avec un regard critique

Contacts: Guillaume Brysbaert, Ségolène Caboche, Sylvain Legrand (mails)

Access conditions

- Savoir utiliser un ordinateur (Windows...) : naviguer sur internet (Internet Explorer ou Firefox), utiliser un traitement de texte (Word ou OpenOffice).
- Être familié avec les banques de données, Blast, formats de séquences et alignements de séquences (idéalement avoir suivi le module 1/4 « Banques de données et Blast » et le module 2/4 « Alignements de séquences » du cycle d'initiation à la bioinformatique).

Trainees:
12 trainees / year
Training time:
2 day(s) / year
No upcoming session scheduled

Cycle « Initiation à la bioinformatique » - Module 4/4 : Initiation à la reconstruction phylogénétique en biologie moléculaire

Description

bilille propose un cycle de découverte de la bioinformatique à destination des chercheurs, enseignants-chercheurs, ingénieurs, techniciens et doctorants en biologie. Aucun pré-requis en informatique n'est attendu.

Le cycle est constitué de quatre modules de deux jours:

- Banques de données et BLAST
- Alignement de séquences
- Prédiction de gènes et annotation de protéines
- Initiation à la reconstruction phylogénétique en biologie moléculaire

Ces modules peuvent être suivis indépendamment, mais ont une cohérence. Suivre chaque module peut aider à une meilleure compréhension des modules suivants.

Les fiches descriptives des différents modules sont accessibles sur le site web de bilille.

Les objectifs du module 4 sont :

- Comprendre les grands principes de l’évolution moléculaire et de la reconstruction phylogénétique
- Savoir construire des alignements informatifs pour une analyse phylogénétique
- Comprendre les modèles phylogénétiques probabilistes, les méthodes d'inférence et savoir les appliquer
- Savoir reconstruire des arbres phylogénétiques en Maximum de vraisemblance (ML) et par Inférence Bayésienne (BI)
- Etre capable d’analyser avec un regard critique les résultats obtenus

Contacts: Guillaume Brysbaert, Ségolène Caboche, Sylvain Legrand (mails)

Access conditions

- Il est conseillé mais non nécessaire d’avoir suivi le module 1/4 « Banques de données et Blast » et le module 2/4 « Alignements de séquences » du cycle d'initiation à la bioinformatique.

Trainees:
12 trainees / year
Training time:
1 day(s) / year
No upcoming session scheduled

Initiation à Galaxy

Description

bilille organise une formation d'initiation à Galaxy, destinée aux biologistes ou médecins désirant découvrir le traitement bioinformatique de données via une interface conviviale. Galaxy est très répandu pour l’analyse de données omiques, telles que données de séquençage ou données de puces à ADN. Cette initiation à Galaxy est une formation interne à bilille.
 

Access conditions
Not documented
Internal publications
External publications
Publications with the hosting laboratory
cea
cnrs
inra
inria
inserm
logo-investissements