100 ans de données météorologiques d’Environnement et Changement climatique Canada dans Commons

En 2019, nous nous sommes engagés dans un projet audacieux : libérer un ensemble complet de données structurées provenant d’une institution gouvernementale dans les projets Wikimedia, afin de maximiser sa diffusion et sa réutilisation. Environnement et Changement climatique Canada, qui relève du Gouvernement du Canada, a accepté de financer notre projet pour deux ans, soit jusqu’au 31 mars 2021. Nous désirons vous partager le fruit de plusieurs mois de travail.

100 ans de données météo?

Oui, vous avez bien lu. Les relevés météo les plus anciens au pays remontent à 1840, soit plus de 170 ans. En 2021, le Service météorologique d’Environnement et changement climatique Canada (ECCC) fête ses 150 ans, ce qui en fait l’une des plus vieilles institutions canadiennes. Tout un «patrimoine» météorologique! La complétude des relevés des 8 756 stations météorologiques dispersées d’un océan à l’autre de notre territoire rendent ces informations scientifiques intéressantes et précieuses dans un contexte de données ouvertes et de sensibilisation de la population aux changements climatiques. Ces données sont déjà en accès libre sur le site Internet d’ECCC, mais nous tenions à mettre en valeur cette mine d’informations brutes.

Le projet

Carte de toutes les stations météo du Service météorologique du Canada ayant déjà existé. Miguel Tremblay. CC BY 4.0

La première phase (2019-2020) consiste en l’import massif des données météo d’ECCC dans Commons. On parle de dizaines de paramètres relevés (température, vitesse des vents, précipitations, etc.). En tout, quatre jeux de données météo sont rendus disponibles par ECCC : l’almanach (soit les records), les données mensuelles, les données quotidiennes et les données horaires. C’est un énorme volume de données et cet import massif n’a pas de précédent dans le projet Commons, où l’on retrouve habituellement des images, des vidéos et des enregistrements audio. Pour ne pas se mettre à dos la communauté, il a été décidé durant cette première phase d’importer uniquement les données d’almanach et les données mensuelles. On parle de plus de 26 millions de données en tout! Cet import massif de données gouvernementales est une première mondiale à notre connaissance.

La deuxième phase (2020-2021) consiste à trouver des idées pour mettre en valeur ces données et les disséminer au travers des projets Wikimedia, comme Wikipédia, qui reste de loin le projet le plus connu et le plus consulté de la famille de projets Wikimedia. Wikimédia Canada a donc collaboré avec deux institutions et réseaux scientifiques ayant à coeur notre mission : l’Acfas et IVADO. Nous avons organisé une première présentation, le 27 janvier 2021. C’était la première fois que nous évoquions le projet en dehors de notre petite équipe. Pourtant, ce fut un véritable succès. Sur notre invitation, plus de 60 personnes issus de différents organismes (privés, gouvernementaux, paragouvernementaux, OBNL,…) se sont jointes à nous. Quelques semaines plus tard, nous réunissons 12 personnes d’horizons divers pour tenir une séance de remue-méninges et bénéficier de l’intelligence collective.

Nous voulons répondre à trois questions :

Les résultats

  • Comment utiliser ces données et les disséminer au travers des projets Wikimedia pour leur donner un sens et les rendre accessibles au plus grand nombre?
  • Comment influencer le reste du monde à importer des jeux de données similaires pour les mettre en accès libre dans les projets Wikimedia?
  • Comment ces données peuvent nous aider à adresser certaines questions sur les changements climatiques?

L’import de données a nécessité la création de quatre outils (un outil de téléversement, un outil de fusion, un outil de discrimination et enfin, un outil de conversion). Il a fallu passer d’un modèle de données en format XML au format JSON, plus restrictif, mais qui est utilsé globalement par les projets Wikimedia.

Le remue-méninges a donné quatre grands axes pour disséminer les données : 1. la visualisations de données, 2. la valorisation descriptive des données météo pour “augmenter” des informations relatives à des événements, des lieux ou des personnes, 3. la valorisation prescriptive des données météo pour aider à la décision dans différents secteurs et d’autres pays, 4. la création de pages Meta-Wiki (pages servant à coordonner les projets) pour inviter les Wikimédiennes et Wikimédiens partout dans le monde à reproduire le projet.

Le rapport final et autres liens utiles

Consultez le rapport final (ainsi que l’annexe A + annexe B) du projet 100 ans de données météo d’ECCC dans Commons.

Nous avons présenté les résultats dans le cadre d’une présentation scientifique au 55e congrès de la Société canadienne de météorologie et d’océanographie, le 1er juin 2021. Référence : 100 years of Weather Observations from the Meteorological Service of Canada in Wikimedia Commons (Wikipedia), Ha-Loan Phan (Wikimédia Canada), Pierre Choffet (Wikimédia Canada), Miguel Tremblay (Environnement et Changement climatique Canada).

Écoutez l’entrevue-balado de Bruno Guglielminetti du 22 janvier 2021.

Consultez la page Meta du projet.

Au cours de l’été, nous vous présenterons nos deux stagiaires, Ali Sabzi (Polytechnique Montréal) et Laurence Taschereau (Université du Québec à Montréal), qui poursuivront le travail de mise en valeur des données d’ECCC dans le cadre du stage « Des données pour raconter » d’IVADO, encadré par Wikimédia Canada et l’Acfas.

Photo Eureka Weather Station : Erik Charlton
Image des stations météorologiques : Miguel Tremblay