bilille

Adress
Batiment M3, Faculté des Sciences et Technologies, Université de Lille
Pôle recherche de la faculté de médecine, Université de Lille 59000 Lille
Structure(s)
CNRS
Unit:
Université de Lille, CNRS, INSERM, Institut Pasteur de Lille, Inria, CHRU Lille
[field_pole_regional_de_rattachem]
Website
Bilille
Scientific leader(s)
Technical leader(s)
Technical leader
Not documented
Certificat(s)
  • France-Génomique
Annual visits:
36 000 an
Unique visits:
3 600 an
Quotes:
247
Latest update:
03-12-2018

Norine

Description

Norine is a public computational resource with a web interface and REST access to a knowledge-base of
nonribosomal peptides. It also contains dedicated tools : 2D graph viewer and editor, comparison of NRPs,
MyNorine, a tool allowing anybody to easly submit new nonribosomal peptides, Smiles2monomers (s2m), a
tool that deciphers the monomeric structure of polymers from their chemical structure.

Access conditions

Freely access to Norine.

Annual visits:
Not documented
Unique visits:
Not documented
Quotes:
57
Downloads:
100

CRAC

Description

CRAC proposes a novel way of analyzing reads that integrates genomic locations and local coverage, and delivers all above mentioned predictions in a single step. CRAC uses a double k-mer profiling approach to detect candidate mutations, indels, splice or fusion junctions in each single read.

Access conditions

CRAC is released under a CECiLL licence (a GPL-compliant licence). You can download it and install it on your server.

Annual visits:
Not documented
Unique visits:
Not documented
Quotes:
25
Downloads:
Not documented

Vidjil

Description

Vidjil is an open-source platform for the analysis of high-throughput sequencing data from lymphocytes. V(D)J recombinations in lymphocytes are essential for immunological diversity. They are also useful markers of pathologies, and in leukemia, are used to quantify the minimal residual disease during patient follow-up. High-throughput sequencing (NGS/HTS) now enables the deep sequencing of a lymphoid population with dedicated Rep-Seq methods and software.

Vidjil contains a high-throughput algorithm extracting V(D)J junctions and gather them into clones. This analysis is based on a seed heuristics and is fast and scalable, as, in the first phase, no alignment is performed with database germline sequences. Vidjil also contains a dynamic browser and a patient database for visualization and analysis of clones and their tracking along the time in a MRD setup or in a immunological study.

Access conditions

Vidjil is open-source, released under GNU GPLv3 license. You are welcome to redistribute it under certain conditions. This software is for research use only and comes with no warranty.

The browser can be accessed at rbx.vidjil.org/browser. The development code of Vidjil is available on GitHub, and the command-line version of Vidjil can also be downloaded below.

Annual visits:
Not documented
Unique visits:
Not documented
Quotes:
507
Downloads:
Not documented

SortMeRNA

Description

SortMeRNA is a biological sequence analysis tool for filtering, mapping and OTU-picking NGS reads. The core algorithm is based on approximate seeds and allows for fast and sensitive analyses of nucleotide sequences. The main application of SortMeRNA is filtering rRNA from metatranscriptomic data. Additional applications include OTU-picking and taxonomy assignation available through QIIME v1.9+ (http://qiime.org - v1.9.0-rc1).

SortMeRNA takes as input a file of reads (fasta or fastq format) and one or multiple rRNA database file(s), and sorts apart rRNA and rejected reads into two files specified by the user. Optionally, it can provide high quality local alignments of rRNA reads against the rRNA database. SortMeRNA works with Illumina, 454, Ion Torrent and PacBio data, and can produce SAM and BLAST-like alignments.

Access conditions

SortMeRNA is implemented in C++ and freely distributed under the GNU lesser general public license (LGPL).
 

Annual visits:
Not documented
Unique visits:
Not documented
Quotes:
93
Downloads:
Not documented

Carnac

Description

Carnac is a software tool for analysing the hypothetical secondary structure of a family of homologous RNA. It aims at predicting if the sequences actually share a common secondary structure. When this structure exists, Carnac is then able to correctly recover a large amount of the folded stems. The input is a set of single-stranded RNA sequences that need not to be aligned. The folding strategy relies on a thermodynamic model with energy minimization. It combines information coming from locally conserved elements of the primary structure and mutual information between sequences with covariations too.

Access conditions

You can use Carnac via the web interface. It is also possible to download and install it locally (carnac.tar.gz and read_me). You need a C compiler.
A Windows executable is also available in this zip archive .

Annual visits:
Not documented
Unique visits:
Not documented
Quotes:
76
Downloads:
Not documented

DiNAMO

Description

The DiNAMO software implements an exhaustive algorithm to detect over-represented IUPAC motifs in a set of DNA sequences. It has two modes: scanning mode, where all windows are parsed, or fixed-position mode, where only motifs occurring at a specific position in the sequences are taken into account.

DiNAMO can be used in a variety of applications, such as ChIP-seq peak analysis for transcription factor binding sites identification, or finding motifs that induce systematic sequencing errors.

Access conditions

Aucune

Domains of activity
  • Computer Science
  • Biology
  • Biomedical
  • Environment
Keywords:
  • NGS data analysis
  • Methodology
  • Genome and transcriptome assembly
  • Read mapping
  • Genomics (DNA-seq)
  • Genome analysis
  • Structural and functional genome annotation
  • Transcriptomics (RNA-seq)
  • Differential gene expression analysis
  • Transcripts and transcript variants analysis
  • Variant calling
  • Panels (amplicons, captures)
  • Exomes
  • Analysis of gene expression regulation
  • Chip-seq
  • Small and long non-coding RNAs
  • Metagenomics, metatranscriptomics
  • Sequence analysis
  • Sequence algorithmics
  • (multiple) Sequence Alignment
  • Sequence annotation
  • Sequence motif discovery
  • Structural bioinformatics
  • Biostatistics
  • Descriptive statistics
  • Statistical tests
  • Regression
  • Multivariate analysis
  • Dimension reduction
  • Information and communication technology developments
  • Tools
  • Tool integration
  • Interoperability
  • Interfaces, web portals
  • Workflows developments
  • Data
  • Data integration
  • Data management and transfer
  • Databases and information systems
  • Evolution and phylogeny
  • Molecular evolution
  • Genes and genomes
  • Comparative genomics
  • Genome comparison
  • Genomics: Chips
  • DNA chips
  • CGH
  • RNA chips
  • Expression
  • Immunogenetics
  • Immune repository analysis
  • Immunoinformatics
  • Proteomics
  • Statistical Differential Analysis

Formation professionnelle

Trainees:
12 trainees / year
Training time:
2 day(s) / year
Upcoming session :
07-03-2019

Cycle « Analyse de données de séquençage à haut-débit » - Module 1/5 : Analyses ADN

Description

bilille propose chaque année un cycle de formation d'introduction à l'analyse des données de séquençage à haut débit.

Ce cycle est composé de 5 modules, à la carte : 

- Module 1: Analyses ADN

- Module 2: Analyses de variants

- Module 3: Analyses RNA-seq, bioinformatique

- Module 4: Analyses RNA-seq, biostatistique

- Module 5: Métagénomique

Les fiches descriptives sont accessibles sur le site de bilille. Chaque module comprend des présentations générales et des séances pratiques sur ordinateur, avec Galaxy.

Les objectifs du module 1 sont :

- Apprendre à manipuler des données de séquençage d’ADN
- Réaliser des contrôles de qualité et du nettoyage des lectures
- Présenter les méthodes et outils d'alignement
- Réaliser des contrôles de qualité et des alignements sur une référence
- Introduction à l’assemblage des lectures sans référence
- Utiliser la plateforme Galaxy pour ces analyses

Contacts: Guillaume Brysbaert, Ségolène Caboche, Sylvain Legrand (mails)

Access conditions

Etre familier avec la plate-forme web Galaxy (idéalement avoir suivi la formation bilille « Initiation à Galaxy »)

Trainees:
12 trainees / year
Training time:
3 day(s) / year
Upcoming session :
01-04-2019

Cycle « Analyse de données de séquençage à haut-débit » - Module 2/5 : Analyses de variants

Description

bilille propose chaque année un cycle de formation d'introduction à l'analyse des données de séquençage à haut débit.

Ce cycle est composé de 5 modules, à la carte : 

- Module 1: Analyses ADN

- Module 2: Analyses de variants

- Module 3: Analyses RNA-seq, bioinformatique

- Module 4: Analyses RNA-seq, biostatistique

- Module 5: Métagénomique

Les fiches descriptives sont accessibles sur le site de bilille. Chaque module comprend des présentations générales et des séances pratiques sur ordinateur, avec Galaxy.

Les objectifs du module 2 sont :

- Comprendre les grands principes de la détection de variants
- Réaliser les différentes étapes du post-traitement des données d’alignement à la détection de variants
- Adapter l’analyse en fonction du type de données NGS générées
- Comprendre la structure des données de variants
- Savoir annoter des variants
- Etre capable d’interpréter une liste de variants grâce aux outils libres disponibles

Contacts: Guillaume Brysbaert, Ségolène Caboche, Sylvain Legrand (mails)

Access conditions

- Etre familier avec la plate-forme web Galaxy (idéalement avoir suivi la formation bilille « Initiation à Galaxy »)
- Avoir suivi le module 1/5 « Analyses ADN » de ce cycle ou toute autre formation permettant de justifier de connaissances sur les données de séquençage haut débit et leur alignement

Trainees:
12 trainees / year
Training time:
2 day(s) / year
Upcoming session :
13-06-2019

Cycle « Analyse de données de séquençage à haut-débit » - Module 3/5 : Analyses RNA-seq - partie 1 (bioinformatique)

Description

bilille propose chaque année un cycle de formation d'introduction à l'analyse des données de séquençage à haut débit.

Ce cycle est composé de 5 modules, à la carte : 

- Module 1: Analyses ADN

- Module 2: Analyses de variants

- Module 3: Analyses RNA-seq, bioinformatique

- Module 4: Analyses RNA-seq, biostatistique

- Module 5: Métagénomique

Les fiches descriptives sont accessibles sur le site de bilille. Chaque module comprend des présentations générales et des séances pratiques sur ordinateur, avec Galaxy.

Les objectifs du module 3 sont :

- Savoir réaliser une analyse transcriptomique par RNA-seq avec ou sans (de novo) génome de référence à l’aide du portail Galaxy
- Avoir un regard critique sur la qualité des lectures obtenues par le séquenceur
- Connaître et savoir paramétrer les outils nécessaires à l’analyse

Contacts: Guillaume Brysbaert, Ségolène Caboche, Sylvain Legrand (mails)

Access conditions

Etre familier avec la plate-forme web Galaxy (idéalement avoir suivi la formation bilille « Initiation à Galaxy »)

Avoir suivi le module 1/5 « Analyses ADN » de ce cycle ou toute autre formation permettant de justifier de connaissances sur les données de séquençage haut débit et leur alignement.

Trainees:
12 trainees / year
Training time:
2 day(s) / year
Upcoming session :
16-09-2019

Cycle « Analyse de données de séquençage à haut-débit » - Module 4/5 : Analyses RNA-seq - partie 2 (biostatistique)

Description

bilille propose chaque année un cycle de formation d'introduction à l'analyse des données de séquençage à haut débit.

Ce cycle est composé de 5 modules, à la carte : 

- Module 1: Analyses ADN

- Module 2: Analyses de variants

- Module 3: Analyses RNA-seq, bioinformatique

- Module 4: Analyses RNA-seq, biostatistique

- Module 5: Métagénomique

Les fiches descriptives sont accessibles sur le site de bilille. Chaque module comprend des présentations générales et des séances pratiques sur ordinateur, avec Galaxy.

Les objectifs du module 4 sont :

- Savoir réaliser une analyse différentielle de données RNA-seq à partir d’une table de comptage (quantifiant les lectures alignées) à l’aide du portail Galaxy

- Avoir un regard critique sur les résultats d’une analyse différentielle

- Comprendre différentes méthodes de normalisation et les contextes d’utilisation correspondants

Contacts: Guillaume Brysbaert, Ségolène Caboche, Sylvain Legrand (mails)

Access conditions

- Etre familier avec la plate-forme web Galaxy (idéalement avoir suivi la formation bilille « Initiation à Galaxy »)
- Avoir suivi le module 2/5 «Analyses RNA-seq–partie 1 (bioinformatique)» de ce cycle ou toute autre formation permettant de justifier de connaissances sur les données de séquençage haut débit et la façon d’obtenir une table de comptage

Trainees:
12 trainees / year
Training time:
3 day(s) / year
Upcoming session :
20-11-2019

Cycle « Analyse de données de séquençage à haut-débit » - Module 5/5 : Métagénomique

Description

bilille propose chaque année un cycle de formation d'introduction à l'analyse des données de séquençage à haut débit.

Ce cycle est composé de 5 modules, à la carte : 

- Module 1: Analyses ADN

- Module 2: Analyses de variants

- Module 3: Analyses RNA-seq, bioinformatique

- Module 4: Analyses RNA-seq, biostatistique

- Module 5: Métagénomique

Les fiches descriptives sont accessibles sur le site de bilille. Chaque module comprend des présentations générales et des séances pratiques sur ordinateur, avec Galaxy.

Les objectifs du module 5 sont :

- Connaître les différentes méthodes de séquençage à haut débit pour la métagénomique, avec leurs avantages et leurs limites : métagénomique ciblée, métagénomique génomes entiers, métatranscriptomique
- Comprendre les différentes étapes analytiques du traitement bioinformatique des données et savoir les mettre en œuvre
- Savoir conduire une analyse statistique pour l’estimation de la richesse de la biodiversité
- Aller jusqu’aux conclusions biologiques

Contacts: Guillaume Brysbaert, Ségolène Caboche, Sylvain Legrand (mails)

Access conditions

- Etre familier avec la plate-forme web Galaxy (idéalement avoir suivi la formation bilille « Initiation à Galaxy »)
- Avoir suivi le module 1/5 « Analyses ADN » de ce cycle ou toute autre formation permettant de justifier de connaissances sur les données de séquençage haut débit et leur alignement. Etre familier avec le vocabulaire et les étapes de base de l’analyse de données de séquençage : nettoyage, assemblage, mapping

Trainees:
12 trainees / year
Training time:
2 day(s) / year
No upcoming session scheduled

Cycle « Initiation à la bioinformatique » - Module 1/4 : Banques de données et Blast

Description

bilille propose un cycle de découverte de la bioinformatique à destination des chercheurs, enseignants-chercheurs, ingénieurs, techniciens et doctorants en biologie. Aucun pré-requis en informatique n'est attendu.

Le cycle est constitué de quatre modules de deux jours:

- Banques de données et BLAST
- Alignement de séquences
- Prédiction de gènes et annotation de protéines
- Initiation à la reconstruction phylogénétique en biologie moléculaire

Ces modules peuvent être suivis indépendamment, mais ont une cohérence. Suivre chaque module peut aider à une meilleure compréhension des modules suivants.

Les fiches descriptives des différents modules sont accessibles sur le site web de bilille.

Les objectifs du module 1 sont :

- Découvrir différentes banques de données de séquences généralistes
- Savoir interroger les banques de données et réaliser des requêtes pertinentes
- Comprendre la structure des données
- Savoir utiliser de manière optimale le logiciel Blast en fonction de l'application visée (ex : recherche d’homologie, prédiction de gènes…)
- Etre capable d'analyser un résultat avec un regard critique

Contacts: Guillaume Brysbaert, Ségolène Caboche, Sylvain Legrand (mails)

Access conditions

Savoir utiliser un ordinateur (Windows...) : naviguer sur internet (Internet Explorer ou Firefox), utiliser un traitement de texte (Word ou OpenOffice).

Trainees:
12 trainees / year
Training time:
2 day(s) / year
No upcoming session scheduled

Cycle « Initiation à la bioinformatique » - Module 2/4 : Alignement de séquences

Description

bilille propose un cycle de découverte de la bioinformatique à destination des chercheurs, enseignants-chercheurs, ingénieurs, techniciens et doctorants en biologie. Aucun pré-requis en informatique n'est attendu.

Le cycle est constitué de quatre modules de deux jours:

- Banques de données et BLAST
- Alignement de séquences
- Prédiction de gènes et annotation de protéines
- Initiation à la reconstruction phylogénétique en biologie moléculaire

Ces modules peuvent être suivis indépendamment, mais ont une cohérence. Suivre chaque module peut aider à une meilleure compréhension des modules suivants.

Les fiches descriptives des différents modules sont accessibles sur le site web de bilille.

Les objectifs du module 2 sont :

- Découvrir les différents types d'alignement pour les séquences protéiques et nucléiques
- Savoir choisir le logiciel et les paramètres adaptés à une problématique (alignement local, global, multiple...)
- Comprendre les méthodes algorithmiques pour l'alignement de séquences
- Comprendre les paramètres des logiciels
- Etre capable d'analyser un résultat d'alignement avec un regard critique

Contacts: Guillaume Brysbaert, Ségolène Caboche, Sylvain Legrand (mails)

Access conditions

- Savoir utiliser un ordinateur (Windows…) : naviguer sur internet (Internet Explorer ou Firefox), utiliser un traitement de texte (Word ou OpenOffice).
- Etre familier avec les banques de données, Blast et formats de séquences (idéalement avoir suivi le module 1/4 « Banques de données et Blast » du cycle d'initiation à la bioinformatique).

Trainees:
12 trainees / year
Training time:
2 day(s) / year
No upcoming session scheduled

Cycle « Initiation à la bioinformatique » - Module 3/4 : Prédiction de gènes et annotation de protéines

Description

bilille propose un cycle de découverte de la bioinformatique à destination des chercheurs, enseignants-chercheurs, ingénieurs, techniciens et doctorants en biologie. Aucun pré-requis en informatique n'est attendu.

Le cycle est constitué de quatre modules de deux jours:

- Banques de données et BLAST
- Alignement de séquences
- Prédiction de gènes et annotation de protéines
- Initiation à la reconstruction phylogénétique en biologie moléculaire

Ces modules peuvent être suivis indépendamment, mais ont une cohérence. Suivre chaque module peut aider à une meilleure compréhension des modules suivants.

Les fiches descriptives des différents modules sont accessibles sur le site web de bilille.

Les objectifs du module 3 sont :

- découvrir les logiciels liés à la prédiction de gènes et à l'annotation de protéines
- acquérir la méthodologie pour prédire les gènes présents sur un génome qu'il soit bactérien ou eucaryote
- acquérir la méthodologie pour analyser la séquence protéique prédite et en déduire la fonction possible de la protéine, avoir une idée de sa localisation cellulaire et de sa structure
- être capable d'analyser les résultats obtenus par les logiciels avec un regard critique

Contacts: Guillaume Brysbaert, Ségolène Caboche, Sylvain Legrand (mails)

Access conditions

- Savoir utiliser un ordinateur (Windows...) : naviguer sur internet (Internet Explorer ou Firefox), utiliser un traitement de texte (Word ou OpenOffice).
- Être familié avec les banques de données, Blast, formats de séquences et alignements de séquences (idéalement avoir suivi le module 1/4 « Banques de données et Blast » et le module 2/4 « Alignements de séquences » du cycle d'initiation à la bioinformatique).

Trainees:
12 trainees / year
Training time:
2 day(s) / year
No upcoming session scheduled

Cycle « Initiation à la bioinformatique » - Module 4/4 : Initiation à la reconstruction phylogénétique en biologie moléculaire

Description

bilille propose un cycle de découverte de la bioinformatique à destination des chercheurs, enseignants-chercheurs, ingénieurs, techniciens et doctorants en biologie. Aucun pré-requis en informatique n'est attendu.

Le cycle est constitué de quatre modules de deux jours:

- Banques de données et BLAST
- Alignement de séquences
- Prédiction de gènes et annotation de protéines
- Initiation à la reconstruction phylogénétique en biologie moléculaire

Ces modules peuvent être suivis indépendamment, mais ont une cohérence. Suivre chaque module peut aider à une meilleure compréhension des modules suivants.

Les fiches descriptives des différents modules sont accessibles sur le site web de bilille.

Les objectifs du module 4 sont :

- Comprendre les grands principes de l’évolution moléculaire et de la reconstruction phylogénétique
- Savoir construire des alignements informatifs pour une analyse phylogénétique
- Comprendre les modèles phylogénétiques probabilistes, les méthodes d'inférence et savoir les appliquer
- Savoir reconstruire des arbres phylogénétiques en Maximum de vraisemblance (ML) et par Inférence Bayésienne (BI)
- Etre capable d’analyser avec un regard critique les résultats obtenus

Contacts: Guillaume Brysbaert, Ségolène Caboche, Sylvain Legrand (mails)

Access conditions

- Il est conseillé mais non nécessaire d’avoir suivi le module 1/4 « Banques de données et Blast » et le module 2/4 « Alignements de séquences » du cycle d'initiation à la bioinformatique.

Trainees:
12 trainees / year
Training time:
1 day(s) / year
No upcoming session scheduled

Initiation à Galaxy

Description

bilille organise une formation d'initiation à Galaxy, destinée aux biologistes ou médecins désirant découvrir le traitement bioinformatique de données via une interface conviviale. Galaxy est très répandu pour l’analyse de données omiques, telles que données de séquençage ou données de puces à ADN. Cette initiation à Galaxy est une formation interne à bilille.
 

Access conditions
Not documented
Internal publications
External publications
Publications with the hosting laboratory
cea
cnrs
inra
inria
inserm
logo-investissements