#DataViz : WTFcsv, un outil d’analyse de données en ligne pour les fichiers au format csv
Vous avez un fichier de données au format csv? WTFcsv est un outil gratuit et en ligne pour faire l’analyse des données avec une représentation visuelle.
De plus en plus de plateformes mettent à disposition des données en libre accès (j’y reviens dans un prochain article). Que ce soit dans l’éducation, la santé ou les transports, ces plateformes utilisent souvent le format csv, compact et compatible avec Excel. Toutefois, la quantité importante de données rend parfois l’analyse complexe.
Et s’il était possible de dégrossir les données du fichier rapidement avant d’entrer dans les détails ?
C’est ce que propose WTFcsv : son unique objectif est de vous en dire plus sur le contenu de votre fichier csv. Vous saurez ainsi dans quel sens poursuivre une analyse détaillée du fichier ou si le contenu correspond bien à vos attentes.
Comment marche WTFcsv ?
L’outil est accessible directement en ligne. Il suffit de charger son fichier csv pour avoir une analyse du contenu.
Le site propose quelques fichiers exemples pour avoir une idée du résultat obtenu. Pour cela :
- vous choisissez un exemple dans « use a sample »
- vous cliquez sur « Analyze » pour lancer l’analyse des données.
Pour l’exemple, j’ai récupéré un fichier sur le site data.gouv.fr , la plateforme de diffusion de données publiques de l’Etat Français. En cette période de confinement en France, certaines enseignes sont fermées ou ont modifié leurs horaires.
J’ai trouvé sur cette plateforme, la liste des enseignes nationales et leur statut d’ouverture [1]. Le fichier est censé contenir des informatons sur les supermarchés, pharmacies, opticiens, boulangeries, banques… au format csv [2].
Une fois récupéré, j’ai juste à importer le fichier via l’onglet « upload a file » et cliquer sur « analyze » comme avec l’exemple.
Une analyse de données macro mais utile
En sortie de l’analyse, j’obtiens un bilan des informations du fichier et différents graphes pour chaque colonne du fichier [3].
Cette analyse rapide permet de faire ressortir les informations accessibles dans le fichier. On apprend par exemple que :
- le fichier contient 233 lignes répartis sur 8 colonnes
- supermarchés, banques, garages, magasins de bricolage et assurances sont les enseignes les plus documentées
- les autres catégories d’enseignes sont regroupées dans « autres »
- l’analyse des noms d’enseigne donne des indices : carrefour, banque populaire, domino pizza,…
- les règles d’ouvertures montrent que 88 enseignes sont fermées et 56 ouvertes. Les autres sont en ouverture partielle ou adaptée.
On trouve aussi des informations sur le mode de contact (échanges à distance, sur rendez-vous, appel avant de se déplacer, etc…)
Astuce : En cliquant sur le bouton « i » en haut à droite de chaque carte, vous pouvez alterner entre la vision « graphe » et la vision « texte ».
Ainsi, sans ouvrir le fichier, vous pouvez déjà voir s’il y a une information pertinente dans le fichier en question. Après cette compréhension de la structure qui est une première étape, on peut aller plus loin sur Excel ou d’autres outils plus complexes de DataViz ou DataAnalyse.
Gratuit, rapide et pratique, cet outil est un bon point de départ pour comprendre vos fichiers de données. Essayez par vous même.
Qu’en avez-vous pensé? Avez-vous d’autres outils du même style à recommander ?
Quelques articles ressources cités dans l’article :