Dans les coulisses de Migale #15
Chers utilisatrices et utilisateurs,
Voici quelques nouvelles et événements à vous partager en cette fin d’année, avec entre autres un retour transparent sur la coupure imprévue de notre infrastructure fin septembre.
Ressources humaines
Nous avons eu le plaisir d’accueillir début octobre Maxime Courcelle, nouvel ingénieur bioinformaticien permanent de l’équipe ; il vient ainsi renforcer le service d’analyse de la plateforme pour répondre à vos demandes croissantes de collaborations et/ou d’accompagnement.
Émilie Fernandez a été recrutée en octobre sur un contrat de mission scientifique pour poursuivre le développement informatique de l’entrepôt de données de Ferments du Futur ; elle croise donc Jonathan Duperrier qui a quitté l’équipe.
Début novembre, l’équipe a également accueilli deux autres ingénieurs contractuels : Edmond Berne qui travaille sur l’intégration de données d’holobiontes au sein du projet Mudis4LS et Anthony Pragassam qui travaille sur le développement de composants Galaxy dans le cadre du projet Galaxy-Bioprod du PEPR B-BEST.
Démarche qualité
Comme chaque année, nous lançons notre enquête annuelle pour recueillir les avis “clients”, comme on dit dans le jargon de la norme ISO 9001 que nous suivons, et ainsi continuer d’améliorer la qualité du service rendu. C’est en effet suite à la dernière enquête que nous avons modifié certaines modalités de communication auprès de vous. Nous vous serions ainsi très reconnaissant de prendre 5 minutes pour remplir cette enquête avant Noël lien vers l’enquête.
Responsabilité environnementale
Dans le cadre de notre politique environnementale, nous pouvons désormais communiquer aux laboratoires intéressés le nombre d’heures de calcul qu’ils ont effectuées par année (2023 et 2024) sur le cluster de Migale. Pour cela, il vous suffit d’envoyer un mail à help-migale@inrae.fr avec la liste des logins des agents de votre unité. Le LBBE a été le premier labo à nous le demander afin de pouvoir prendre en compte l’empreinte carbone de leurs calculs dans celle du labo via l’outil GES 1point5. Bravo !
Infrastructure et sécurité informatique
Nous allons vous faire ci-dessous un retour sur les arrêts de fin septembre, en toute transparence.
Nous vous l’avions annoncé lors de notre précédente newsletter, l’arrêt annuel du Data Center INRAE-IDF nous a obligé à interrompre l’ensemble des services numériques de la plateforme du lundi 22 matin au jeudi 25 septembre en fin d’après-midi. Cet arrêt, planifié et annoncé quelques semaines à l’avance, a été suivi d’un arrêt non planifié le vendredi 26 septembre qui a occasionné des services dégradés jusqu’au lundi 29 septembre.
- Quelques éléments de contexte
Nos machines sont hébergées au sein d’un data center opéré par le CEA, le TGCC. La DSI INRAE loue une salle au sein de ce data center et y opère, pour les unités INRAE, un service d’hébergement sec. Depuis 2016, la plateforme Migale est donc cliente directe de la DSI INRAE pour l’hébergement de ses machines, et - à travers INRAE - du CEA.
Le TGCC est un centre de calcul de niveau international et héberge des équipements de pointe. Il opère des arrêts annuels pour sa maintenance, généralement en septembre, dont nous sommes tributaires et qui occasionnent des coupures sur plusieurs jours.
Chaque arrêt planifié nous oblige à arrêter de façon séquentielle l’ensemble des services et serveurs de la plateforme (une cinquantaine de services, autant de machines physiques). Ces opérations, bien que grandement automatisées, demandent des étapes de vérification manuelles et sont assez chronophages (~4h) et mobilisent pleinement une partie de l’équipe. Nous profitons également de ces arrêts forcés pour faire les mises à jour (système, firmware) et ainsi ne pas ajouter de coupures additionnelles qui génèrent des temps d’indisponibilité pendant l’année.
Jeudi 25 septembre, vers 18h, nous avions ainsi terminé comme prévu le redémarrage de l’ensemble des services et nous vous l’avons annoncé par mail.
- Coupure imprévue
Vendredi 26 septembre en fin de matinée, une coupure électrique imprévue a brutalement arrêté l’ensemble de nos machines. C’est le pire scénario qui puisse se produire dans un data center car cela occasionne souvent de la casse matérielle et des soucis au redémarrage (service mal arrêté…).
Nous avons d’abord cherché à connaître la cause de la coupure, puis à en évaluer l’impact. Après quelques heures, les premières informations dont nous disposions de la part de la DSI INRAE, faisaient état d’une situation qui n’était pas encore stabilisée. Ce n’est finalement que le vendredi en fin d’après-midi que nous avons eu la confirmation d’une alimentation électrique stable et rétablie.
Nous avons alors fait le choix de rétablir en priorité, les services critiques (cluster et accès aux données) dès le vendredi soir et de ne redémarrer les autres services (Galaxy, applis web) que lundi matin.
La cause de cet incident a finalement été identifiée. Il s’agissait d’un déclenchement automatisé fallacieux de contre-mesures prévues en cas de détection incendie. L’analyse fine des causes est encore en cours, mais le CEA a d’ores et déjà pris des mesures pour éviter qu’un tel incident ne se reproduise.
- Conclusion
Ce n’est malheureusement pas le seul incident de ce type que nous avons eu à déplorer ces dernières années. Soyez assurés que ces situations dégradées nous impactent également, elles mettent à mal notre matériel et surtout ne correspondent pas au service que nous souhaitons vous proposer.
Nous échangeons avec la DSI INRAE, au travers de contacts directs ou du comité utilisateur de services, pour qu’elle continue à travailler avec le CEA sur l’amélioration du service que celui-ci propose.
Sachez que nous restons très attachés à la qualité des services que nous vous proposons et faisons tout ce qui est en notre pouvoir pour que celui-ci reste le meilleur possible.
Formations
Notre cycle 2026 de formation “Bioinformatique par la pratique” ouvrira lundi 12 janvier 2026. Tous les modules 2025 seront reproposés ; vous pourrez retrouver le calendrier et la description des modules dès le 12/01 sur la page web dédiée
Animation
L’équipe Migale s’est fortement investie ces dernières semaines dans l’animation de la communauté française via les 3 événements ci-dessous :
- Les premiers FROGSDays, symposium dédié aux enjeux techniques et méthodologiques du metabarcoding microbien, ont eu lieu du 1er au 3 décembre 2025 à INRAE Castanet-Tolosan (Toulouse). Cet événement s’adressait à toutes les personnes intéressées par le traitement et l’analyse de données de séquençage haut débit appliquées à la diversité microbienne – utilisateurs de FROGS ou non. Le programme a mis l’accent sur le partage d’expériences, les innovations bioinformatiques, et les perspectives du domaine. Des démonstrations d’outils, deux tables rondes et des sessions posters ont rythmé ces trois jours.
- Le groupe de travail StatOmique basé sur le partage d’expérience autour de la modélisation et l’analyse statistique de données omiques a organisé une journée scientifique à Nantes le 25 novembre 2025.
- Le GDR de Bioinformatique BIMMM a consacré sa journée bisannuelle le 26 novembre à Nantes sur quel pourrait être son rôle dans la prise en compte des enjeux environnementaux dans nos activités de recherche en bioinformatique.
Un de vos travaux réalisés sur la plateforme Migale
Dans le cadre de leur projet SUBSILAKE et MARWEL (ANR PRC et JCJC), des chercheuses et chercheurs de l’Université Claude Bernard Lyon 1, du CNRS et du MNHN se sont intéressés au potentiel métabolique de nouvelles lignées microbiennes identifiées dans un lac tropical aux conditions extrêmes, le Dziani Dzaha (Mayotte). Les capacités de calcul de la plateforme Migale ont permis l’annotation fonctionnelle et la résolution de la position phylogénétique de ces nouvelles lignées inconnues. Les résultats de l’étude du consortium, publiés dans la revue Environnemental Microbiome, ont démontré l’existence de métabolismes originaux au sein de la lignée des Planctomycetes-Verrucomicrobia-Chalmydiae, révisant ainsi nos connaissances sur les rôles écologiques possibles des membres de ce phylum microbien.
N’hésitez pas à nous partager vos travaux qui citent la plateforme.
Pour nous rencontrer
Nous serons présents au workshop Statistical Methods for Post Genomic Data les 29-30 janvier 2026 à Grenoble.
Migalement vôtre,
L’équipe 