Collecter et traiter vos données gratuitement avec Google Formulaire et RStudio

Vous vous posez une question sur l’entrainement ou sur les performances de vos sportifs(ves). Vous savez quelles données vous voulez utiliser pour votre analyse. Maintenant comment collecter et traiter vos données.

La première solution est le recours à des plateformes en ligne. Elles sont payantes. Si elles sont gratuites, c’est que le produit c’est vous ! Vous payez en donnant gratuitement vos données (et leur permettre d’avoir de la matière pour analyser). De plus, vous n’avez pas tant de libertés que ça pour mener vos investigations et répondre a vos questions. Il y a toujours des limitations.

La seconde solution est de collecter et traiter soit même ses données.

Collecter des données

Vous pouvez très bien utiliser un formulaire papier. Mais c’est dommage car il existe de outils gratuit en ligne pour tout automatiser. Olivier Hanicotte avait proposé une vidéo d’exemple de création d’un formulaire en ligne sur Google Form. Cette solution permet de récupérer les données sous forme de tableur en ligne.

Traiter les données

Une fois les données disponibles sur le tableur se pose la question du traitement. Quand la prise de données n’est pas fréquente et que le volume est faible, il n’y a pas trop de problème à faire l’analyse sur le tableur.

En revanche, lorsque le volume et/ou la fréquence de données sont plus important il y a un problème. Lorsque les données changes ou sont mise à jours, les formules de calcul ou la sélection pour le graphique doivent être changés. Pas pratique. D’où l’intérêt grandissant d’entraîneurs et de préparateurs physiques dans les langages de programmation comme R ou Python. En R ou en Python il y a séparation en le fichier de données et le fichier d’analyse. Quand les données changent il n’a pas besoin de changer le script. Une vidéo de Nicolas Brunn résume bien ce sujet.

Je vous propose de voir comment récupérer les données de votre formulaire sur RStudio depuis le tableur de réponse.

Pour commencer vous devez publier votre tableur sur le web :

Fichier -> Publier sur le web -> puis choisissez la feuille souhaitée et le format csv.

Vous pouvez à présent récupérer un lien type docs.google.com/spreadsheets.

Il faut à présent passer sur Rstudio. Dans notre exemple nous allons utiliser les réponses à un formulaire de bien-être type Hooper sur 2 mois. Nous allons ensuite :

  • Importer les données du lien Google vers R.
  • Nous assurer du format de certaines variables (date par exemple)
  • Visualiser le fichier de données
 # Importation données depuis le tableur
url<- "VOTRE LIEN GOOGLE SPREADSHEET.CSV"

#Lecture des données csv
data <- read.csv(url)

# Conversion du format colonne date en date (si necessaire)
as.Date(data$Date, format = "%d/%m/%Y")

# lecture 6 premières lignes
View(data)

Vérifions ce que nous avons sur le fichier de données.

Note : le fichier de données sur RStudio sera mis à jours à chaque fois que vous lancez le code précédent.

Vous pouvez ensuite lancer votre script d'analyse. Par exemple, rapidement, examiner la distribution des valeurs des variables sommeil/fatigue/stress/courbature.

 

# Histogramme des différentes variables
par(mfcol = c(2, 2))
hist(data$sommeil, main = "Sommeil", xlab="Note 1-7")
hist(data$fatigue, main = "Fatigue",xlab="Note 1-7")
hist(data$stress, main = "Stress",xlab="Note 1-7")
hist(data$courbatures, main = "courbatures",xlab="Note 1-7")

Il est déjà possible de constater que toutes les variables n'ont pas une distribution symétrique. Donc attention avec l'utilisation des moyennes et médianes.

J'espère que cette solution simple et gratuite pour collecter et traiter vos données sportives vous aidera à répondre à vos questions. Libre à vous d'utiliser les données et l'analyse de votre choix.