Analyse du langage des candidats élection régionale IDF 2021

A l’occasion des élections régionales, j’ai analysé le langage des candidats pour la région Ile-De-France.

Tâches réalisées:

  • Récupération des données (web scraping, OCR, API Twitter)
  • nettoyage des données
  • préparation des données (retrait balises code, suppression ponctuation et stopwords, Tokenisation et Lemmatisation)
  • analyse descriptive
  • analyse exploratoire

Configuration:

Environnement : Colaboratory notebook, CPU

Librairies : pandas, numpy, matplotlib, seaborn, scikit-learn, missingno, bs4, nltk, re