Service DDIT
 

L’objectif de ce service est de fournir un support informatique (matériel et logiciel) aux tâches aussi bien scientifiques (bioinformatique) que logistiques (IT) qui le nécessitent au sein de l’institut.

Équipe

  • Raphaël Helaers, biofinformaticien, est le responsable du service. Il gère les projets logiciels, le cluster HPC et les services qui lui sont liés. Vous pouvez le contacter pour les services décrits ci-dessous avec la mention (RH).

  • Jacques Vanclève, IT Manager, s’occupe de résoudre les problèmes IT qui surviennent à l’Institut et les projets nécessitant un support IT. Vous pouvez le contacter pour les services décrits ci-dessous avec la mention (JV).

  • Mickaël Nguyen, développeur, est principalement impliqué dans le développement informatique de Sirona.

Services proposés

Les services suivants sont actuellement proposés, agrémentés d’exemples déjà mis en place et/ou en cours de développement :

  • Développer et maintenir des logiciels personnalisés permettant de gérer ou d’automatiser des données scientifiques ou logistiques (RH).

    • DDUV Order : logiciel qui permet à tous les membres de l’institut de passer des commandes, qui via la même interface peuvent être validées par les PI, encodées par les CLC dans le système UCLouvain, tracées de leur livraison à leur stockage dans le labo, et automatisant une partie de la gestion des factures pour la comptabilité. Toutes les informations concernant DDUV Order se trouvent sur sa page intranet.

    • Sirona : solution extensive qui permettra de gérer l’ensemble des données de chaque laboratoire de l’institut – stockages, échantillons, produits, patients, expériences, résultats, projets, … Toutes les informations concernant Sirona se trouvent sur sa page intranet.

    • Phosphofinder : logiciel utilisé par la plateforme MASSPROT qui permet d’automatiser l’analyse des peptides via une interface graphique. Toutes les informations concernant Phosphofinder se trouvent sur sa page intranet.

    • Toute autre proposition de développement de logiciel pour réaliser des tâches précises ou résoudre une problématique peut être soumise au service DDIT.

  • Mettre à disposition une capacité de calcul nécessaire aux analyses bioinformatiques (RH). Ceci implique de maintenir et mettre régulièrement à jour notre cluster HPC, mais également de fournir un accès et d’encadrer les chercheurs désirant l’utiliser eux-mêmes.

    • Actuellement une trentaine de chercheurs de l’institut ont un compte utilisateur sur le cluster et peuvent y lancer eux-mêmes leurs analyses avec un système de réservation de ressources (nombre de processeurs et mémoire désirés) et de file d’attente intelligente.

  • Mettre en place et maintenir des services bioinformatiques sur le cluster HPC, pour les groupes qui en ont une utilisation régulière/intensive (RH)

    • Les pipelines d’analyse NGS : ils traitent des données brutes provenant de WES, WGS, panels ou RNAseq et produisent des données exploitables pour des analyses biologiques. La plate-forme PGEN l’utilise quotidiennement.

    • Le pipeline d’analyse 10X Genomics : il traite les données brutes provenant d’un séquençage Single Cell et produit des données qui peuvent ensuite être visualisées avec les outils graphiques de 10X Genomics  sur un « simple » poste de travail.

    • Alphafold : un algorithme récemment publié par Google qui utilise l’intelligence artificielle pour prédire la structure de n’importe quelle protéine de manière bien plus précise que toutes les alternatives existantes. Il utilise pour ce faire des processeurs graphiques (GPU) qui sont installés sur une infrastructure dédiée du cluster. Vous pouvez soumettre vos protéines via la page intranet dédiée.

    • R Studio serveur : une version centralisée de R studio (utilisable à distance depuis n’importe quel poste de travail) bénéficiant des ressources importantes dont dispose le cluster HPC. Le groupe CBIO de Laurent Gatto l’utilise quotidiennement et l'interface est accessible ici.

    • Toute autre proposition de logiciel existant à installer sur le cluster peut être soumise au service DDIT.

  • Mettre à disposition des serveurs informatiques sous forme de machines virtuelles. (RH & JV) En pratique, c’est une partie du cluster qui s’isole du reste de l’infrastructure en se réservant les ressources nécessaires à son fonctionnement (processeurs, mémoire, espace de stockage). Ceci permet par exemple de pouvoir générer à la demande un serveur pour héberger un site internet/intranet ou pour un logiciel nécessitant un ordinateur « puissant » pour tourner. Cela évite d’acheter, de maintenir et de sauvegarder des ordinateurs dédiés, tout en optimisant l’utilisation des ressources (on peut facilement les augmenter ou les diminuer à la demande).

  • Gérer et mettre à disposition une solution de stockage de masse. (RH & JV)  Plusieurs centaines de térabytes d’espace sont mis à disposition sous forme de répertoires à accès contrôlé (permettant par exemple à tous les membres d’un même groupe d’y accéder). Ces données sont répliquées plusieurs fois et des « instantanés » sont gardés plusieurs fois par semaine (vous ne devez donc pas garder de « backup » de vos données). C’est donc une solution beaucoup plus sûre et plus rapide d’accès que des solutions de type disques durs partagés / NAS que certains groupes utilisent actuellement.

  • Fournir un support à l’achat et à l’installation du matériel informatique. (JV) Un accompagnement sera apporté pour le choix de la configuration matériel adéquat au besoin des utilisateurs autant pour les machines Windows et OSX, et à l’installation du matériel à la livraison de la commande.

  • Fournir un support à la configuration des différents logiciels. (JV) Ceux disponibles via l’UCL, mais aussi pour les outils spécifiques d’analyse et d’administration au sein de l’Institut.

  • Fournir un support réseau. (JV) Active l’accès réseau des équipements nécessitant une connexion réseau filaire ou Wi-Fi au sein de l’Institut.

  • Apporter un support de première ligne pour régler les problèmes informatiques. (JV) En collaboration avec le service informatique de l’UCL (SIBX), un support direct sera fourni aux utilisateurs pour tous les problèmes liés aux matériels informatiques et logiciels.

  • Aider à la maintenance et à la gestion des bases de données spécifiques aux groupes de recherche. (JV) Différentes bases de données liées au domaine de recherche spécifique des groupes sont hébergées et gérées au sein de l’Institut.

  • Apporter des solutions de backup des données de recherche individuelles. (JV) Aider les utilisateurs à sauvegarder leurs données de manière pérenne en leur proposant des outils adéquats selon leurs besoins.

  • Fournir un support pour l’utilisation des systèmes de visioconférences. (JV) Plusieurs solutions de Visio conférence sont disponibles au sein de l’institut, fixe ou mobile.

Tarification

La plupart de ces services étant utiles à la collectivité, leur coût est entièrement supporté par l’Institut. Pour d’éventuels projets ayant une portée limitée à un groupe, ils pourront être facturés selon l’ampleur de tâche (à évaluer par le DDI).

Cluster HPC

L’institut de Duve dispose d'un cluster informatique hautes performances. Vous pouvez trouver toutes les informations utiles, dont une documentation sous forme de WIKI, sur la page intranet du cluster. Le cluster est composé de plusieurs groupes de machines avec des profils dédiées.

  • 1 nœud d’entrée (ddus) : la machine dite « ddus » a pour vocation d’être dédiée aux utilisateurs. Celle-ci dispose de 64Gb de RAM et 8 coeurs (16 threads), d'un espace de stockage local de 12 Tb en RAID 1, ainsi qu’un SSD de 1Tb dédié à MySQL. Il permet aux utilisateurs de tester leurs jobs localement avant leur soumission. L’espace de stockage permet aux chercheurs employant ce cluster d’y transférer de manière plus aisée des informations telles que des datasets devant probablement être développés/stockés directement sur le cluster. Les logiciels installés sur ddus sont tous déployés à l’identique sur l’ensemble des machines du cluster.

  • 10 nœuds à haute capacité de calcul (dd01-dd10) : ces machines servent pour l’ensemble des services proposés ; et représentent la force de travail nette la plus importante du cluster. Leur configuration a été pensée en ayant pour objectif de maximiser le nombre de coeurs, la quantité de ram installée et l’espace disque tant HDD que SSHD. Le stockage partagé est rendu disponible en un seul volume de ~600Tb via BGFS sur ZDF (RAID 5). Chacune des 10 machines dispose de 2 CPU AMD Epyc 7281 (16 Cores @ 2.1Ghz) et 128 Gb de RAM. Elles offrent un total de 320 coeurs (740 threads), 1.2 Tb de RAM et 1.1 Pb de stockage brut.

  • 2 nœuds à haute capacité de mémoire (ddc1-ddc2) : ces machines aux processeurs plus modestes ont cependant beaucoup de mémoire RAM à leur disposition, permettant de réaliser certaines analyses très gourmandes en mémoire. Chacune des 2 machines dispose de CPU AMD 64 cœurs et de 256 Gb de RAM. Elles offrent un total de 128 coeurs, 512 Gb de RAM et 8 Tb de stockage.

  • 2 nœuds dédiés aux GPU (dd-gpu01 – dd-gpu02) : ces machines sont équipées de GPU (processeurs graphiques) permettant de faire tourner à grande vitesses certaines applications tirant parti de cette technologie (e.g. Alphafold). La machine dd-gpu01 est équipée d’un GPU RTX 3080Ti (10 240 cœurs CUDA, 12G mémoire), 2 CPU AMD (12 cœurs chacun) et 220 GB de RAM. La machine dd-gpu02 est équipée de 4 GPU GTX 1070Ti (2 432 cœurs CUDA, 8G mémoire), 2 CPU AMD (12 cœurs chacun) et 220 GB de RAM.

  • 3 nœuds backup : ces machines sont dédiées à la réplication des données du cluster afin de pallier aux problèmes matériels qui pourraient survenir et garantir l’intégrité des données stockées.