BIOINFORMATIQUE
ANALYSES DE DONNÉES DE SÉQUENCAGE À HAUT DÉBIT
La plupart des technologies NGS génèrent des données sous la forme de reads (séquences), rassemblées dans un fichier (e.g. FASTQ pour un Illumina HiSeq, XSQ pour un LifeTechnologie Solid, etc). Ces données brutes sont inutilisables telles quelles, jusqu'à ce qu'elles soient traitées par différents algorithmes générant des données "analysables" (e.g. l'appel des variants pour un séquençage d'exome). Nous appelons ce processus "analyse de tier-1" et il consiste en un pipeline de logiciels qui effectuent différents traitements informatiques sur les données brutes. Par exemple, si vous avez séquencé un génome, exome ou panel de gènes, vous disposerez d'un ou plusieurs fichiers FASTQ comme données brutes. Un pipeline tier-1 typique alignera les reads à un génome de référence, nettoiera l'alignement en résultat (e.g. en éliminant les reads dupliqués, en effectuant des réalignements locaux, et en recalibrant les scores de qualité) et appelera les variants. Les fichiers résultants inclueront un alignement (fichier BAM) et un appel de variants (fichier VCF), qui eux pourront être analysés en aval par les utilisateurs.
HIGHLANDER
Comme le NGS produit des quantités énormes de données, l'analyse d'un appel de variants est loin d'être triviale. Pour ces analyses de tier-2, un support bioinformatique est généralement essentiel, mais la plupart des outils informatiques existants sont généralement complexes à utiliser par les non-informaticiens. Pour cette raison, nous avons développé le logiciel Highlander, permettant aux biologistes d'analyses leurs données NGS via une interface graphique ergonomique et relativement simple d'utilisation. Vous pouvez jeter un oeil à la page web du projet pour plus d'informations.
Avant de travailler avec des données NGS et/ou le logiciel Highlander, nous vous suggérons fortement de visionner les videos de formation suivantes:
- Séminaire théorique sur la génération et l'analyse des données génomiques NGS
- Formation sur l'utilisation du logiciel Highlander
Ces videos sont en français, mais vous pouvez également accéder à des versions en anglais en passant la langue de cette page web sur EN.
CLUSTER
La plate-forme dispose du cluster de calcul HPC (High Performance Cluster) géré par le service DDIT, qui héberge différents services tels qu'Highlander, et qui peut réaliser n'importe quelle sorte d'analyse NGS. Vous pouvez consulter le service DDIT pour plus d'informations sur les services disponibles ainsi que les utilisations possible du cluster et sa configuration.
SERVICES DISPONIBLES
La plate-forme intersectorielle de génomique offre un support technique et scientifique pour les projets impliquant du séquençage. Nous analysons les exomes [WES], génomes [WGS], panels de gènes [panels] et transcriptome [RNAseq]. La plate-forme propose un volet bioinformatique pour les analyses NGS sous la forme des services suivants :
- Analyse tier-1 de données brutes NGS via notre pipeline (e.g. alignement, nettoyage des données et appel des variants sur des données de génome/exome/panel, générant les fichiers BAM et VCF depuis un FASTQ).
- Analyse tier-2 de données NGS, via notre logiciel maison Highlander.
- Consultance : pour les projets scientifiques ayant des spécificités non couvertes par les pipelines standards et Highlander, la plateforme propose un service de consultance soit sous forme de collaboration scientifique, soit tarifée. Cela reprend également des supports ponctuels comme par exemple :
- Transfert de données (download sur le cluster, upload sur des répertoires publics)
- Vérification de la qualité des données
- Formation (e.g. utilisation d’Highlander)
- Analyse bioinformatique personnalisée
- …
Toutes les analyses sont effectuées sur notre cluster par notre bioinformaticien (voir contact ci-dessous), mais un accès personnel peut vous être fourni sur demande. Merci de le contacter pour toute collaboration.
TARIFICATION
Notez que quand un service est proposé à un externe UCLouvain les 25% de PAFG sont compris dans le tarif qui est indiqué HTVA.
Analyses NGS
Ce service comprend la prise en charge des données (téléchargement/téléversement des données brutes sur le cluster ainsi que leur stockage à long terme), analyse tier-1 via le pipeline approprié (générant BAM, VCF et QC), importation dans la base de données Highlander, et accès illimité au logiciel pour les analyses de type tier-2 par le demandeur lui-même.
Pour ce service, nous proposons un tarif par échantillon proportionnel au service fourni.
Notez que des frais de consultances (voir ci-dessous) peuvent être ajoutés dans le cas où vos données nécessitent un ajustement du pipeline, et que ce dernier ne profite qu'à vous (e.g. mettre en place un génome de référence spécifique).
Tarif par échantillon |
Membre UCLouvain |
Externe |
WGS |
45€ |
140€ |
WES |
45€ |
140€ |
Panel |
45€ |
140€ |
Shallow WGS |
10€ |
30€ |
RNAseq* |
10€ |
30€ |
* Les analyses RNAseq comprennent le pipeline tier-1 : alignement, quantification, appel des variants de type SNV, INDEL, SV (fusion, LINE) et import dans Highlander, mais pas d’autres analyses tier-2 telle que l’analyse de l’expression différentielle.
Consultance
Le service de consultance pour des projets scientifiques peut être fourni sous forme de collaboration ou tarifé comme suit (à définir avec le responsable de plate-forme lors de l’analyse du projet).
La tarification varie selon quel profil sera impliqué dans le projet : bioinformaticien, développeur informatique ou un « mix » des deux.
Si le temps à investir sur projet est court et prévisible, nous fonctionnons avec une facturation horaire.
Tarif horaire |
Membre UCLouvain |
Externe |
Développeur |
30€ |
100€ |
Bioinformaticien |
60€ |
200€ |
Mix |
50€ |
160€ |
Si le temps total à investir sur le projet est difficilement prévisible et/ou sera fragmenté dans la durée, nous proposons différents forfait courts, moyens ou longs qui correspondent approximativement à 1 jour, 2-3 jours ou une semaine de travail « agrégé ».
Forfait |
Court UCLouvain |
Moyen UCLouvain |
Long UCLouvain |
Court Externe |
Moyen Externe |
Long Externe |
Développeur |
250€ |
500€ |
1000€ |
750€ |
1500€ |
3000€ |
Bioinformaticien |
500€ |
1000€ |
2000€ |
1500€ |
3000€ |
6000€ |
Mix |
400€ |
800€ |
1600€ |
1200€ |
2400€ |
4800€ |
La tarification pour les projets plus imposants sera à définir lors de son analyse.
CONTACT ET INFORMATION
Raphaël HELAERS, Ph.D.
Laboratoire de Génétique Moléculaire Humaine
Institut de Duve, 74 (5e étage)
02/764.74.72
Email: raphael.helaers@uclouvain.be
LIENS UTILES
- Highlander, un logiciel permettant le filtrage aisé des variants
- Service DDIT, gérant le cluster HPC et divers logiciels de l'institut De Duve