Identifier et localiser les anomalies COVID-19 sur les radiographies pulmonaires

Cinq fois plus mortel que la grippe, le COVID-19 provoque une morbidité et une mortalité importantes. Comme d’autres pneumonies, l’infection pulmonaire par COVID-19 entraîne une inflammation et du liquide dans les poumons. Le COVID-19 ressemble beaucoup à d’autres pneumonies virales et bactériennes sur les radiographies pulmonaires, ce qui le rend difficile à diagnostiquer.

Dans ce travail, j’ai cherché à entraîner un modèle de réseaux de neurones dit “Fully Convolutional Network” à partir du jeu de données d’images issu d’une compétition Kaggle (SIIM-FISABIO-RSNA COVID-19 Detection).

Le modèle à pour objectif de prédire:

  1. La présence d’une opacité
  2. Le type d’opacité (typique, atypique, indéterminée)
  3. La localisation sur l’image (sous forme de boite/rectangle)

Configuration:

Environnement : Kaggle notebook, TPU

Librairies : pandas, numpy, matplotlib, seaborn, scikit-learn, random, tensorflow, keras, PIL, os, shutil, csv, tensorflow_addons

Tâches réalisées:

  • Nettoyage des données ;
  • Exploration des images et labels ;
  • Upsampling et échantillonnage stratifié ;
  • Préparation des données
  • Tests de différents modèles pré-entrainés et de data augmentation
  • Fine tuning
  • Entrainement sur jeu complet
  • Saliency