Objectifs pédagogiques
Cette formation est dédiée à l’analyse de données textuelles (text-mining). L’objectif est l’acquisition des principales techniques pour la Reconnaissance d’Entités Nommées (REN) à partir de textes. Les entités nommées étudiées dans cette formation sont des objets ou concepts d’intérêts mentionnés dans les articles scientifiques ou les champs en texte libre (taxons, gènes, protéines, marques, etc.).
Les participants vont acquérir les compétences pratiques nécessaires pour effectuer de façon autonome une première approche pour une application de text-mining. Le format est celui de Travaux Pratiques utilisant AlvisNLP, un outil pour la création de pipelines en text-mining développé par l’équipe Bibliome de l’unité MaIAGE. La formation s’adresse à des chercheurs et ingénieurs en (bio)-informatique ou en maths-info-stats appliquées
Programme
- Présentation du text-mining et de la Reconnaissance des Entités Nommées (REN)
- Travaux Pratiques sur des techniques de REN en utilisant AlvisNLP
- Projection de lexiques
- Application de patrons
- Apprentissage automatique
Pré-requis
- Une connaissance de la ligne de commande Linux est requise.
- Familiarité avec la manipulation de fichiers de données (conversion, filtrage, visualisation)
Intervenants
Mouhamadou Ba / Robert Bossy
A work by Migale Bioinformatics Facility
Université Paris-Saclay, INRAE, MaIAGE, 78350, Jouy-en-Josas, France
Université Paris-Saclay, INRAE, BioinfOmics, MIGALE bioinformatics facility, 78350, Jouy-en-Josas, France