Dans les coulisses de Migale #13
Chers utilisatrices et utilisateurs,
Nous avons pas mal de nouvelles à vous partager avant l’été, notamment sur l’évolution de notre infrastructure numérique.
Ressources humaines
Nous avons été lauréat d’un nouveau contrat d’apprentissage INRAE d’un an à compter de septembre sur un projet lié à la cybersécurité de la plateforme. Toute l’équipe est donc ravie de poursuivre une 3e année avec Axel, notre actuel apprenti en administration système et réseaux.
Démarche qualité
La plateforme Migale est certifiée ISO9001 depuis avril 2011. Cette certification, qui couvre l‘ensemble de nos activités, montre notre engagement collectif sur la poursuite de la satisfaction client, l’amélioration continue de nos activités et la gestion des risques. Cet engagement est vérifié régulièrement par des audits, aussi bien internes organisés par INRAE qu’externes conduits par notre organisme certificateur, la société LRQA. Ces audits durent généralement une journée et ont pour but de vérifier la conformité de notre organisation à la norme.
Le dernier audit externe a été mené par LRQA le 18 avril dernier et a permis de confirmer le respect de la norme par Migale :
« L’objectif de cette visite était d’évaluer la conformité du système de management de l’organisme dénommé INRAE PLATEFORME MIGALE au référentiel ISO 9001:2015 suivant le planning d’audit défini. […]
Au terme de cette visite, la mise en oeuvre opérationnelle des dispositions définies dans le système de management est confirmée. La maîtrise des processus et activités audités permet de garantir la prise en compte des exigences des parties intéressées, des exigences légales et réglementaires, la gestion de l’amélioration continue conformément à la norme citée ci-dessus, et permet, à l’issue de cet audit, de confirmer le maintien de la certification, pour le champ d’application défini ».
Infrastructure et sécurité informatique
Comme nous vous l’annoncions dans notre dernière newsletter, ce printemps a été l’occasion d’un ensemble conséquent de mises à jour pour notre infrastructure.
Tout d’abord, l’ensemble des serveurs et noeuds de calcul ont été mis à jour sur la dernière version 24.04 « long term support » d’Ubuntu. Peu de changements pour vous, côté utilisateur, mais cela nous assure une disponibilité des correctifs de sécurité jusqu’en avril 2029.
À cette occasion, l’ensemble des outils et des banques ont été réinstallés. Cela représente plus de 500 outils installés sur ce nouveau système.
De la même manière, R a été mis à jour en version 4.4.3 et plus de 1700 paquets réinstallés. Le service Rstudio a été migré sur une machine plus récente et mis à jour en version 2024.12.1. N’hésitez pas à continuer à nous remonter les éventuels soucis que vous rencontrez suite à cette mise à jour. Nous nous efforçons de les résoudre au plus vite.
Enfin, le cluster de calcul a partiellement été renouvelé. Il est maintenant composé de trois générations de machines :
- 25 serveurs équipés de processeurs AMD EPYC 7452 2.35 Ghz, 64 coeurs, 256 Go de RAM
- 20 serveurs équipés de processeurs AMD EPYC 7453 2.8 Ghz, 64 coeurs, 128 threads 1024 Go de RAM
- 3 serveurs équipés de processeurs AMD EPYC 7702 2 Ghz, 128 coeurs, 256 threads 4096 Go de RAM
Le cluster est donc maintenant composé de 4928 cœurs et plus de 39 To de mémoire.
À l’occasion de la réinstallation du cluster, nous avons ajusté quelques éléments de configuration, comme la répartition des ressources par queue ou les limites associées à chaque utilisateur. Nous surveillons en effet l’usage que vous faites de ces ressources pour ajuster au mieux ces configurations.
Pour finir, nous vous rappelons que toutes ces ressources sont des ressources partagées et qu’il convient de respecter au mieux les règles pour éviter les incidents impactant l’ensemble des utilisateurs. Nous avons constaté ces dernières semaines beaucoup de calculs lancés sur le serveur frontal, volontairement ou par erreur. Ces calculs peuvent ralentir l’accès de l’ensemble des utilisateurs et sont arrêtés sans préavis.
La migration de la forge INRAE, initialement prévue en mars dernier a été replanifiée en juin 2025. Beaucoup de nos services s’appuient sur cette forge et cette migration aura notamment pour impact une indisponibilité de nos sites web du vendredi 6 juin à partir de 17h30 jusqu’au mardi 10 juin 12h.
Il n’y aura néanmoins pas d’incidence sur les autres services (Galaxy, rstudio, cluster).
Formations
Le cycle de formation 2025 touche bientôt à sa fin mais il reste deux derniers modules auxquels vous pouvez encore vous inscrire :
- Manipulation de données sous R avec Tidyverse (16 et 17 juin)
- Python avancé (15 et 16 septembre)
Responsabilité environnementale
Seulement 5 utilisateurs ou utilisatrices ont participé à notre challenge de ménage numérique 2025, ce qui est décevant au vu des enjeux environnementaux. Néanmoins, nous pouvons grandement les féliciter car les 1 517 949 fichiers supprimés ont libéré plus de 4,7 To de stockage ! Notre motivation pour sensibiliser nos utilisateurs reste forte et d’autres actions sont en cours en ce sens.
Typiquement, nous venons de finaliser l’estimation du bilan de gaz à effet de serre pour l’ensemble de l’infrastructure numérique de la plateforme sur 2023, une démarche saluée lors de notre audit externe du 18 avril 2025 (voir plus haut). Le périmètre de ce premier bilan porte sur l’ensemble des équipements informatiques de la plateforme (serveur frontal, cluster de calcul, solution de stockage, serveur de bases de données, serveur Galaxy, ordinateurs de formation, etc.) et inclut 1 ETP de personnel dédié à sa maintenance. Pour 2023, il s’élève à 26 tonnes d’équivalent CO2 dont 67 % pour la partie “calcul”, 23 % pour la partie “stockage” et 10 % pour le cumul “personnel” et “formation”. Selon la méthode de répartition utilisée, on obtient un ordre de grandeur pour la quantité de carbone émise par heure.coeur de calcul sur Migale comparable aux 3,6 g CO2 eq. de l’étude https://hal.science/hal-02549565v5.
Une de nos récentes contributions à vos côtés
Migale est co-auteur de l’article “Metagenomics reveals contrasted responses of microbial communities to wheat straw amendment in cropland and grassland soils”. Les collègues de l’UMR Agroécologie de Dijon ont pu établir que les communautés microbiennes du sol réagissent rapidement aux changements environnementaux, qu’ils soient naturels ou d’origine humaine.
Cette étude utilise la métagénomique shotgun pour analyser la dynamique microbienne après l’ajout de paille de blé dans le sol, sur une période de 4 mois en conditions réelles. Les résultats obtenus ont été comparés à ceux de l’analyse par séquençage d’amplicons sur les mêmes échantillons afin de valider la métagénomique shotgun comme outil d’analyse fine des dynamiques microbiennes.
Les deux approches ont donné des résultats taxonomiques concordants, mais la métagénomique shotgun a permis de suivre simultanément tous les groupes microbiens, y compris les protistes et les virus souvent négligés. Chaque domaine (bactéries, virus, etc.) a montré une dynamique propre après l’amendement. Par exemple, les virus ont proliféré rapidement au début de la décomposition, en parallèle des bactéries copiotrophes, suggérant un phénomène de type “kill-the-winner”, rarement observé dans les sols.
En conclusion, l’étude montre que les interactions trophiques, à la fois entre et au sein des domaines microbiens, sont modifiées par l’ajout de matière organique, et que ces effets dépendent de l’historique d’usage du sol. Elle suggère aussi que la régulation top-down par les prédateurs microbiens ou les virus joue un rôle crucial dans la dynamique et la structure des communautés microbiennes du sol.
La plateforme a fourni l’environnement bioinformatique nécessaire et le service d’analyse a été sollicité pour analyser les données de métagénomique shotgun.
Pour nous rencontrer
Nous serons présents à JOBIM (8-11 juillet à Bordeaux) avec plusieurs posters à présenter et la co-animation du symposium “Comment concilier nos activités en bioinformatique avec les limites planétaires”
Migalement vôtre,
L’équipe