Objectifs pédagogiques
A l’issue de la formation, les stagiaires seront capables de :
- utiliser les principales fonctions des packages dplyr et tidyr de l’écosystème du « tidyverse »
- lire les données et les ranger dans un format « tidy »
- manipuler les données : filtrer, sélectionner, trier, produire des résultats par groupe, fusionner plusieurs tables
- mettre en forme et pivoter les tables de données
Programme
- Principes du tidyverse
- Principales fonctions de manipulation de données du package dplyr : ajouter de nouvelles variables, sélectionner des colonnes, filtrer des lignes, trier, grouper, fusionner des tables
- Enchaînements des opérations à l’aide de « pipe »
- Mise en forme, jointure et pivot de données avec le package tidyr
Mise en application sur un exemple d’analyse de données de transcriptomique.
Pré-requis
Les stagiaires doivent connaître les bases du langage R ou avoir suivi le module 12 d’initiation au langage R. Il est aussi possible de se former en suivant un des cours d’initiation suivants :
Intervenants
Christelle Hennequet-Antier / Mahendra Mariadassou
A work by Migale Bioinformatics Facility
Université Paris-Saclay, INRAE, MaIAGE, 78350, Jouy-en-Josas, France
Université Paris-Saclay, INRAE, BioinfOmics, MIGALE bioinformatics facility, 78350, Jouy-en-Josas, France