Dans les coulisses de Migale #10

news
Auteur·rice

Migale team

Date de publication

15 janvier 2025

Chers utilisateurs et utilisatrices,

toute l’équipe Migale vous souhaite une excellente année 2025 et vous présente ses meilleurs voeux de réussite professionnelle et personnelle.

Voici quelques nouvelles que nous souhaitons partager avec vous dès maintenant.

Ressources humaines

En ce début d’année, l’équipe accueille deux ingénieurs dans le cadre du grand défi Ferments du Futur (FdF) et autour de la mise en place de l’entrepôt de données SIduri : Agnès Barnabé est en charge du développement de pipelines bioinformatiques pour analyser les données de manière standardisée, tandis qu’Erwan Le Floch est en charge de la gestion des données de FdF, au plus près des porteurs de projets pré-compétitifs.

Mariène Wan et Aaron Millan-Oropeza nous ont quittés en décembre 2024 suite à leur réussite à des concours externes ; ils étaient en charge du développement informatique de l’entrepôt SIduri. De nouvelles personnes seront recrutées sur cette mission très prochainement.

Par ailleurs, Migale est susceptible d’avoir un poste d’IE en bioinformatique ouvert aux concours externes 2025. À suivre !

Démarche qualité

Nous prolongeons l’ouverture de notre enquête annuelle jusqu’au 23 janvier 2025 et vous encourageons à y répondre si ce n’est pas déjà fait. Vos réponses sont importantes pour mesurer l’adéquation entre vos besoins (actuels et futurs) et notre offre de service. Ce sont vos réponses qui nous ont amenées à (re-)proposer certaines formations (Linux, métagénomique shotgun, tidyverse…) et à mettre en place cette newsletter que vous semblez apprécier.

Merci d’avance pour votre contribution, cela ne vous prendra que deux minutes, c’est promis !

Infrastructure

Deux nouveaux noeuds de calcul avec une grande quantité de mémoire vive viennent d’être intégrés au cluster migale. Il s’agit des noeuds « highmem1 » et « highmem2 » qui ont tous les deux les caractéristiques suivantes :

  • AMD EPYC 7702 CPU (256 threads, 128 coeurs)
  • 4 To de RAM

Ces noeuds appartiennent à la queue « highmem.q » et sont accessibles uniquement sur demande et après justification via ce formulaire (connexion requise).

Formations

La cuvée 2025 de notre cycle de formation “Bioinformatique par la pratique” est désormais ouverte ! Vous retrouverez toutes les informations utiles (dates, contenus pédagogiques, formulaires d’inscription, tarifs, etc.) sur la page Trainings de notre site web. Ce n’est pas moins de 16 modules qui vous sont proposés, couvrant une large palette de compétences à acquérir :

Autour de R et Python :

  • Initiation au langage R (11 et 12 mars)
  • Graphiques sous R avec ggplot2 (13 mars)
  • Manipulation de données sous R avec tidyverse (16 et 17 juin)
  • Développement d’une application avec R Shiny (14 mars)
  • Initiation à Python (31 mars, 1er avril)
  • Python avancé (2 et 3 avril)

Autour de Linux, Galaxy et des bonnes pratiques de développement

  • Initiation à Linux (5 février)
  • Initiation à l’utilisation de Galaxy (20 mars)
  • Bonnes pratiques pour une meilleure reproductibilité de ses analyses (4 avril)

Autour des données NGS et RNAseq

  • Traitement bioinformatique et analyse différentielle de données d’expression RNA-seq sous Galaxy (17 au 19 mars)
  • Analyse primaire de données issues de séquenceurs nouvelle génération sous Galaxy (21 mars)
  • Analyse statistique de données RNA-Seq - Recherche des régions d’intérêt différentiellement exprimées sous RStudio (12 et 13 mai)

Autour de la génomique comparative et la biologie structurale

  • Comparaison de génomes microbiens (19 et 20 mai)
  • Modélisation in silico de structures 3D de protéines. Prédiction de mutations. Arrimage de ligands. (4 et 5 juin)

Autour des données métagénomiques

  • Analyse de données métagénomiques « shotgun » (6 et 7 mai)
  • Analyse de données de metabarcoding (23 au 26 juin)

BioinfOmics

L’Infrastructure de Recherche INRAE BioinfOmics, dont Migale fait partie, a organisé en décembre dernier son Assemblée Générale à Toulouse suivie d’une demi-journée scientifique sur le thème de la pangénomique et d’un atelier pour pratiquer des outils de reconstruction de pangénomes.

Une de nos récentes contributions

Nous vous présentons easy16S, une application web en open access interactive et conviviale conçue pour simplifier les analyses statistiques primaires des données du microbiome. Cette application permet aux scientifiques d’explorer et de visualiser leurs données de manière autonome et efficace. Basée sur un objet « phyloseq », easy16S intègre une matrice d’abondance des OTU/ASV, une table de métadonnées des échantillons et une matrice d’assignation taxonomique. Son interface intuitive est orientée pour la visualisation des variables d’intérêt sur la structuration des communautés microbiennes.

Après avoir chargé ses données résultant du pipeline d’analyse bioinformatique, l’utilisateur peut facilement les prétraiter par filtrage et transformation. Il peut ensuite réaliser diverses figures et analyses en quelques clics, allant des figures d’abondance aux analyses de distances écologiques, en passant par les mesures de diversités et les analyses multivariées couramment utilisées pour l’étude des données du microbiome.

L’application s’adresse aussi bien aux débutants qui souhaitent réaliser leurs analyses statistiques en toute autonomie, qu’aux experts désireux de visualiser rapidement des motifs et tendances au sein de leurs données, ainsi qu’aux apprenants lors de sessions de formation.

En 2024, l’application easy16S a été utilisée plus de 4 500 fois. Pour en savoir plus, vous pouvez aussi lire la publication associée dans Journal of Open Source Software. Si vous êtes intéressé, n’hésitez pas à contacter cedric.midoux@inrae.fr.

Pour nous rencontrer

Nous serons présents au hackathon SK8 (3-5 février à Montpellier) et à la journée shiny::inrae (6 février, Montpellier).

Migalement vôtre,

L’équipe


A work by Migale Bioinformatics Facility
Université Paris-Saclay, INRAE, MaIAGE, 78350, Jouy-en-Josas, France
Université Paris-Saclay, INRAE, BioinfOmics, MIGALE bioinformatics facility, 78350, Jouy-en-Josas, France