Data Viz 101

Initiation à la datavizualisation en Python

Léo Mignot & Mickael Temporão

2026-01-08

Dataviz everywhere

Pas nouveau :

Mais se diffuse/démocratise :

  • production plus simple avec numérique (crayon vs. ordi)
  • et plus récemment diffusion en ligne, viralité
    • #dataviz

But why ?

never trust summary statistics alone; always visualize your data

Datasaurus par Alberto Cairo

Définition-ish

Dataviz / infographie / figures scientifiques

  • Same same, but different ?
  • Diffuser des résultats
  • Les rendre compréhensibles
  • Mettre en valeur et transmettre l’information

“can’t see anything”

Graph crimes

Tour de table

  • Léo & Mickael
  • Vous !

Organisation du cours

  • Le syllabus précise tout ça
  • (Les slides suivantes reprennent les infos)

Objectifs de ce cours :

À la fin du semestre, vous saurez :

  • Concevoir et produire des graphiques pour vos projets.
  • Réaliser les étapes clés d’un projet de visualisation : chargement, préparation, analyse, et production graphique.
  • Choisir un type de visualisation pertinent selon les données et le message que vous souhaitez véhiculer.
  • Mobiliser des bibliothèques Python devenues incontournables en data visualisation.

Format du cours et programme

  • Format atelier
  • Dimension pratique, avec des temps d’application et exercices sur des cas concrets.

Le module est organisé en séquences progressives :

  1. installation de l’environnement de travail,
  2. introduction au traitement et la manipulation de données,
  3. réalisation de différents types de visualisations.

Bloc 1 – Mise en place & premiers pas (2 séances)

Objectif : permettre à chacun·e de disposer d’un environnement de travail fonctionnel

  • Présentation du cours et des attendus
  • Présentation de l’environnement de développement (Google Colab) et prise en main
  • Exécution d’une première visualisation à partir d’un code fourni par les enseignants

Bloc 2 – Initiation à Python et à Pandas (4 séances)

Objectif : acquérir les bases de la programmation et du traitement de données

  • Syntaxe de base en Python
  • Introduction à Pandas : chargement de bases, nettoyage, recodage, analyse
  • Manipulation de variables et statistiques descriptives
  • Préparation des données pour la visualisation

Bloc 3 – Visualisation de données (6 séances)

Objectif : maîtriser les grands types de visualisation selon la nature des variables

  • Visualisations univariées : histogrammes, barplots, boxplots
  • Visualisations bivariées : scatterplots, courbes, boxplots croisés
  • Visualisations cartographiques : initiation à la visualisation spatiale (hexbin maps, cartes choroplèthes)

Évaluation : modalités et attendus

  • Approche incrémentale
  • Remise de (petits) rendus intermédiaires
  • Les rendus débouchent sur un rendu final prenant la forme d’une infographie aboutie
  • Travail en groupe

Les rendus

Date rendu Évaluation Poids Description
Séance 5 Modifications de titres/sous-titres 10% Capacité à choisir des éléments éditoriaux clairs et pertinents
Séance 7 Identification de deux variables et calcul de statistiques descriptives 10% Rigueur dans le choix des variables et la qualité du traitement
Séance 9 Prototype de visualisation univariée 10% Pertinence du graphique et lisibilité
Séance 11 Prototype de visualisation bivariée 10% Pertinence du graphique et lisibilité
Final (10 avril) Figure finale 60% Une visualisation aboutie, respectant tous les critères de qualité attendus

Outils

Ressources

Plein, vues plus tard, mais notamment :

Je code comme une brouette

Sucking

Andrew Heiss : sucking

  • Normal d’avoir des erreurs
  • Importance des petites victoires
  • Vos enseignants aussi galèrent : on fait le pari de découvrir Altair

“Push through. You’ll suck less.”

(Hadley Wickham, author of {ggplot2})