FORMATIONS |
Fiche détaillée d'un cours
Niveau | Année de formation | Période | Langue d'enseignement |
---|---|---|---|
S2 | FrAnglais |
Professeur(s) responsable(s) | Aurélien VANNIEUWENHUYZE |
---|---|
Intervenant(s) | Pas d'autre intervenant |
- Ce cours apparaît dans les formations suivantes :
- Ecole Du Numérique (EDN) - Master 1 Data & Intelligence Artificielle - S2 - 4 ECTS
Pré requis
- Connaissance du langage python
- Connaissance en machine Learning
Objectifs du cours
- Savoir extraire les informations d’un texte
- Être en mesure d’analyser le contenu d’un texte
- Mettre en œuvre un modèle de machine Learning (de sa formalisation à son évaluation) pour la classification de texte
Contenu du cours
- Introduction
- Les éléments d’un texte : Tokenization, Part Of Speech (POS), Name Entity Recognition (NER), la Lemmatization
- L’analyse statistique du contenu d’un texte
- Le modèle de Markov caché appliqué aux Part Of Speech
- Machine Learning appliqué au NLP
- Comparaison de textes à l’aide de la vectorisation (utilisation de la cosine similarity)
- La vectorization : TF, TF-IDF, Bag Of Word, de Word 2 Vec
- La régression logistique appliquée à la classification de texte
- Naïve bayes appliqué à la classification de texte
Modalités d'enseignement
Organisation du cours
34h de cours
Méthodes pédagogiques
Évaluation
* Informations non contractuelles et pouvant être soumises à modification