Fiche détaillée d'un cours


   


Voir la fiche établissement

Natural Language Processing

2023-2024

FrECOLE DU NUMERIQUE ( EDN )

Code Cours :

2324-EDN-COMP-EN-4023


Niveau Année de formation Période Langue d'enseignement 
S2FrAnglais
Professeur(s) responsable(s)Aurélien VANNIEUWENHUYZE
Intervenant(s)Pas d'autre intervenant

    Ce cours apparaît dans les formations suivantes :
  • Ecole Du Numérique (EDN) - Master 1 Data & Intelligence Artificielle - S2 - 4 ECTS

Pré requis


  • Connaissance du langage python

  • Connaissance en machine Learning

Objectifs du cours


  • Savoir extraire les informations d’un texte

  • Être en mesure d’analyser le contenu d’un texte

  • Mettre en œuvre un modèle de machine Learning (de sa formalisation à son évaluation) pour la classification de texte

Contenu du cours


  • Introduction

    • Les éléments d’un texte : Tokenization, Part Of Speech (POS), Name Entity Recognition (NER), la Lemmatization

    • L’analyse statistique du contenu d’un texte

    • Le modèle de Markov caché appliqué aux Part Of Speech






  • Machine Learning appliqué au NLP

    • Comparaison de textes à l’aide de la vectorisation (utilisation de la cosine similarity)

    • La vectorization : TF, TF-IDF, Bag Of Word, de Word 2 Vec

    • La régression logistique appliquée à la classification de texte

    • Naïve bayes appliqué à la classification de texte




Modalités d'enseignement

Organisation du cours

34h de cours

Méthodes pédagogiques


    Évaluation





     
    * Informations non contractuelles et pouvant être soumises à modification
     
     
    Vidéo : Un campus à vivre
    Notre chaîne Youtube