En février 2021, le service transport.data.gouv.fr, qui permet aux applications de calcul d’itinéraires utilisés par les Françaises et les Français de s’alimenter en données de transport, réintègrera le ministère chargé des Transports pour y être pérennisé, après 3 années de construction chez beta.gouv.fr. C’est l’occasion de faire le point sur les enseignements qui peuvent être tirés de ce service qui utilise le levier de l’open data au bénéfice de toutes les voyageuses et de tous les voyageurs de France.
Il y a tout juste trois ans, en janvier 2018, j’ai accepté une mission passionnante, en devenant responsable de l’ouverture des données de transport pour le compte de la plateforme transport.data.gouv.fr, un service numérique conçu par beta.gouv.fr en partenariat avec le ministère chargé des Transports.
Je me souviens qu’on m’avait présenté le problème à résoudre en ces termes : début 2018, en France, en dehors des grandes métropoles (comme Paris, Lyon, Marseille), les données de transport (horaires de bus, stations de vélos en libre-service, localisation des aires de covoiturage) n’étaient que rarement disponibles en ligne de manière ouverte. La conséquence ? Dans la plupart des villes en France, il était souvent impossible de trouver une application de calcul d’itinéraire sur son smartphone ou sur internet pour planifier ses itinéraires en transport public. En l’absence de données facilement accessibles, les applications grand public comme Mappy, Mybus, Transit, Citymapper, Google Maps ou encore Apple Plans, n’offraient pas leur service de calcul d’itinéraire sur la plus grande partie du territoire français.
Aujourd’hui, transport.data.gouv.fr référence plus de 350 jeux de données, et la plupart des applications de calcul d’itinéraire qui couvrent la France s’alimentent régulièrement sur la plateforme. Ainsi, si vous sortez votre smartphone à Grenoble, à Cherbourg ou à Quimper, vous pouvez désormais espérer voir sur votre application de mobilité favorite (ou installée par défaut sur votre appareil) les horaires des lignes locales de transport en commun ; et, partout en France, lorsque vous utilisez une application de covoiturage, celle-ci peut maintenant vous indiquer des lieux aménagés afin de prendre en charge ou déposer un passager, en toute sécurité.
Illustration : état des lieux de l’ouverture des données : cas des transports urbains, en nombre d’autorités organisatrices référencées. Les statistiques complètes en temps réel sont disponibles à transport.data.gouv.fr/stats.
En près de trois ans, l’équipe transport.data.gouv.fr a parcouru la France et a pu échanger avec des centaines d’interlocuteurs et d’interlocutrices impliquées dans l’ouverture ou la réutilisation de données de transport et souvent passionnées par le sujet. Grâce à une communauté particulièrement active (des agents territoriaux impliqués dans l’association OpenDataFrance, des associations comme Vélos & Territoires ou l’Association des Acteurs de l’Autopartage, des entreprises françaises innovantes comme Kisio Digital, Ubitransport, Zenbus ou MyBus), les échanges permanents ont permis de construire un service numérique utile, qui a accéléré l’ouverture des données de transport en France et qui répond vraiment aux besoins des producteurs et des réutilisateurs de données, toujours au bénéfice des voyageuses et des voyageurs.
Mais surtout, nous en avons tiré plusieurs enseignements précieux, qui ont parfois contredit nos intuitions initiales. Je tente dans cet article d’en restituer quelques uns, qui je l’espère, pourront alimenter les futures réflexions de celles et ceux qui continueront à travailler sur le sujet. Ces apprentissages font d’ailleurs écho au tout récent rapport du député Eric Bothorel, et confirment ses propos : il est important de poursuivre les efforts pour toujours ouvrir davantage et cesser d’utiliser de mauvaises excuses pour ralentir la démarche.
A mon arrivée dans l’équipe transport.data.gouv.fr début 2018, je me souviens de nos déjeuners d’équipe durant lesquels nous débattions souvent du bien-fondé de ce que nous entreprenions : les plus gros consommateurs de données de transport sont des géants internationaux comme Google ou Apple, et nous nous demandions si accélérer l’ouverture des données de transport (une démarche rendue obligatoire par un règlement européen) ne revenait pas, en fin de compte, à créer de la valeur qui serait captée par les GAFA. Nous nous sommes cependant rapidement rendu compte que ces entreprises n’avaient pas attendu que les agglomérations ouvrent leurs données pour s’en emparer. Début 2018, Google Maps avait déjà intégré les transports publics de plus d’une quarantaine de villes en France : l’entreprise avait, sans surprise, les moyens de mobiliser des commerciaux pour établir des relations bilatérales avec les territoires qui l’intéressait. Idem pour les applications chéries des automobilistes comme Waze ou Coyote : elles n’ont pas eu besoin de données fournies par l’administration pour fonctionner, puisqu’elles pouvaient compter sur la force des données générées par leur communauté.
En 3 ans, transport.data.gouv.fr a progressivement rendu accessible la plupart des données de transport qui étaient auparavant fermées ou captées par ceux qui avaient les moyens de s’en emparer. Cela a considérablement abaissé la barrière à l’entrée nécessaire au déploiement d’un calculateur d’itinéraire sur de nouveaux territoires. Ce travail a notamment permis le développement de plusieurs petites et moyennes entreprises innovantes françaises ou européennes comme MyBus – qui couvre aujourd’hui 200 réseaux de transport en France, soit 95 % des réseaux dans le pays, et qui a levé 2,4 millions d’euros en 2019, Kisio Digital qui utilise les données de transport.data.gouv.fr pour alimenter navitia.io ou encore Handisco avec sa canne connectée qui aide les personnes malvoyantes à se déplacer.
Cela étant dit, les “gros” en profitent aussi : en février 2020, l’application d’aide à la mobilité d’Apple, installée d’office sur tous les appareils mobiles de la marque et qui ne couvrait alors que les transports publics franciliens, a intégré une dizaine de villes supplémentaires à son calculateur d’itinéraire multimodal en récupérant certains de ces jeux de données sur transport.data.gouv.fr ; de la même manière Citymapper a récemment intégré 6 nouvelles villes. Cette intégration n’est pas une mauvaise nouvelle, au contraire : désormais, les Parisiens et les Lyonnais ne sont plus les seuls en France à pouvoir bénéficier de ces services.
Lors de notre tour de France en 2018, nous rencontrions souvent des agents de collectivités de taille modeste qui nous disaient se demander si l’ouverture des données de transport allait réellement leur apporter quelque chose : leurs efforts d’ouverture allaient-ils être récompensés ? L’obligation d’ouverture n’était-elle pas encore la conséquence d’une énième règlementation européenne dont les citoyennes et les citoyens ne verraient jamais l’impact ? Les calculateurs d’itinéraires allaient-ils réellement intégrer leurs données au sein de leurs applications ? Leurs habitants bénéficieraient-ils vraiment des bénéfices de cette politique dans leur vie quotidienne ? C’étaient les paris qu’avaient faits notre équipe et le ministère chargé des Transports.
Quand transport.data.gouv.fr a publié les données du réseau de transport de la ville de Figeac (Lot) en 2018, l’application Transit rapidement rejointe par MyBus ont directement intégré le jeu de données, au bénéfice des habitants de Figeac qui ne disposaient jusqu’alors pas de service numérique leur indiquant les horaires de leur bus. D’ailleurs, lorsque le jeu de donnée est arrivé à expiration (les horaires du bus de Figeac étant actualisés tous les 6 mois), plusieurs réutilisateurs de données ont manifesté leur mécontentement, constatant que le fichier n’avait pas été mis à jour, ce qui leur empêchait de proposer aux utilisateurs de leur application une information fiable (voir illustration ci-dessous). La preuve que le fichier leur était véritablement utile ! (Le fichier des horaires du bus de Figeac est à présent régulièrement mis à jour à cette page).
Illustration : discussions autour du jeu de données du Grand Figeac en 2019, disponible à https://www.data.gouv.fr/fr/datasets/gtfs-du-reseau-de-transport-urbain-du-grand-figeac/
Contrairement à ce qu’on aurait pu imaginer, ce ne sont donc pas les grandes métropoles, déjà bien équipées, qui ont le plus bénéficié de l’accompagnement de l’équipe transport.data.gouv.fr ; Paris, Grenoble ou Lille n’ont d’ailleurs pas attendu que l’État s’en mêle pour s’équiper et ouvrir leurs données de transport.
Ainsi, le travail de standardisation des données (qui a mené à la création de la base nationale des aires de covoiturage, celle des lieux de stationnement ou bientôt celle des aménagements cyclables) a été essentiellement utile aux petites agglomérations. Sans ces schémas, chaque agglomération publiait ses données “à sa sauce” : noms de colonnes différentes, champs manquants ou additionnels, formats techniques différents… La conséquence ? Si les grandes métropoles pouvaient espérer voir leurs données consommées par les applications de mobilité grand public, il était rare que ces-dernières fassent l’effort de récupérer des fichiers Excel souvent éparpillés sur différentes plateformes open data, tous selon un formalisme différent, pour les petites agglomérations. Aujourd’hui, le réutilisateur n’a plus qu’un seul fichier à intégrer, et ce fichier comprend les données de (quasiment) toute la France.
Ce qui nous a davantage surpris encore, c’est qu’en matière de données temps réel – très utiles pour informer les voyageuses et les voyageurs en cas de perturbation ou de retard sur les lignes de transport –, les agglomérations de taille modeste sont souvent bien plus avancées que les grandes métropoles. Nous avons réussi à rendre accessible facilement les flux dynamiques de réseaux comme ceux de l’agglomération d’Auxerre, de la ville de Honfleur ou de l’île de Ré (soit dit en passant, cette-dernière gagne à mon avis la palme du meilleur nom de réseau de transport : “RespiRé” ! ; d’ailleurs, si vous voulez vous amuser à établir votre propre classement des noms de réseaux de transport français, le moteur de recherche de la plateforme est un bon point de départ, vous y découvrirez que les territoires français ont beaucoup d’imagination en la matière). En revanche, si vous cherchez les données temps réel des grandes métropoles françaises, vous ne les trouverez pas encore sur la plateforme transport.data.gouv.fr. Et pour cause : certains réseaux de taille modeste ont pu s’équiper facilement de nouvelles technologies de géolocalisation (comme ce que proposent les dispositifs Zenbus ou Ubitransport), et sont en capacité de fournir des données dynamiques d’une précision bien supérieure – et pour un coût bien inférieur – aux systèmes complexes et plus difficiles à transformer des transports urbains qui équipent les grandes métropoles. C’est d’ailleurs souvent la crainte du coût de la mise à disposition des données temps réel qui ralentit l’ouverture pour les gros réseaux. Pour répondre à ce frein, transport.data.gouv.fr a mis en place un serveur mandataire (proxy) pour stocker les données temps réel sur ses propres serveurs toutes les 30 secondes, et ainsi limiter la charge des requêtes des réutilisateurs sur les serveurs des réseaux de transport.
Pour les spécialistes des questions européennes liées à la data, c’est la tarte à la crème. Tout commence par une directive européenne qui engage une dynamique d’ouverture des données, puis le Comité européen de normalisation impose des normes à respecter pour harmoniser ces données dans l’ensemble des Etats membres. Les experts des données géographiques se souviennent peut-être de la directive INSPIRE. Côté transports, c’est la directive STI qui a imposé les normes Datex et NeTEx, respectivement pour les données relatives à l’information routière et pour celles liées à l’offre de transport collectif.
Ces normes sont souvent complexes (spécifications longues de centaines de pages, formats techniques peu commodes à manipuler) car elles doivent intégrer les spécificités de 27 Etats membres. Et à côté de ces normes, il y a en général des standards de facto, internationaux, plus simples et certes moins complets, qui sont déjà massivement utilisées par les acteurs du secteur (c’est le cas du GTFS pour les transports collectifs, utilisé pour la première fois par Google en 2005 pour les transports collectifs, à présent enrichie par une communauté internationale animée par l’association MobilityData).
Les normes européennes en matière de données de transport sont parfois décrites par les spécialistes du secteur comme l’Espéranto : utiles en théorie pour que différents pays puissent se comprendre, peu utilisées dans la pratique. (La grande différence, c’est que l’Espéranto est prévue pour une prise en main facile… c’est moins le cas des normes européennes en matière de données de transport).
Sur transport.data.gouv.fr et en accord avec le ministère chargé des Transports, nous avons décidé de couper la poire en deux : toutes les données sont disponibles à la fois dans un standard exploitable facilement par les calculateurs d’itinéraire (GTFS pour les métros, trams et bus par exemple), et elles sont également disponible dans une version convertie conforme aux normes européennes (NeTEx pour les métros, trams et bus). Pour l’instant, aucun calculateur d’itinéraire n’a déclaré être en capacité d’exploiter les données converties à la norme NeTEx (et certains expliquent qu’ils ne le feront peut-être jamais car elle est trop complexe à gérer) ; or, l’objectif européen à long-terme, c’est que petit à petit la norme européenne s’impose. Sujet à suivre, donc.
Les équipes des services accompagnés par beta.gouv.fr, dont fait partie transport.data.gouv.fr, sont toujours obsédées par leur impact dans le monde réel ; en effet, quand on construit un service numérique au sein de l’Etat, il n’y a pas de compte de résultat à la fin de l’année qui nous confirme que l’on est bien rentable ! Il nous faut donc sans cesse nous imposer un questionnement régulier sur notre utilité réelle afin de savoir si ce que nous développons sert vraiment à quelque chose et s’il est pertinent que l’État continue à y investir de l’argent public.
La politique publique poursuivie par transport.data.gouv.fr est l’ouverture des données de transport et a trois objectifs :
a) améliorer l’information voyageur partout en France en permettant aux usagers de savoir facilement comment se rendre d’un point A à un point B quel que soit le mode de transport ;
b) favoriser le développement de services numériques innovants qui pourraient s’alimenter des données ouvertes ;
c) inciter les voyageuses et les voyageurs à abandonner leur voiture individuelle et à adopter des pratiques de mobilité durable quand les itinéraires le permettent.
En ce qui concerne ces deux premiers objectifs, dans un régime open data, il est par définition très difficile de mesurer le nombre de réutilisations et de suivre de manière précise dans quels territoires il est plus facile de planifier un itinéraire, ou quels services numériques se sont développés grâce aux données ouvertes. Ces fichiers sont accessibles librement, sans identification préalable afin de garantir l’absence de barrières à la réutilisation. À date, le meilleur moyen que nous avons trouvé pour mesurer le succès de transport.data.gouv.fr, et par extension, de la politique d’ouverture des données de transport en France, est un mécanisme de déclaration de réutilisation fonctionnant sur la base du volontariat. Plusieurs dizaines de services numériques désormais référencés sur la page d’accueil de transport.data.gouv.fr ont ainsi déclaré leurs réutilisations, ce qui nous prouve que ce travail n’a pas été mené en vain. Par exemple, nous savons par ce biais que viaTransit, Le Localisateur et Transit utilisent les données de Montpellier. Nous avons conscience que ce référencement n’est pas exhaustif : afin de servir davantage les usagers et mettre la priorité sur les actions qui contribuent vraiment à l’amélioration de l’information voyageur, l’équipe réfléchit par exemple à permettre à n’importe quel citoyenne ou citoyen de déclarer sur la plateforme qu’il ou elle n’a pas accès facilement à un calculateur d’itinéraire intégrant les données de son territoire.
Quant au troisième objectif, à notre connaissance, il n’existe pas d’étude mesurant l’impact sur les comportements des usagers en matière de mobilité dans des territoires où les données de transport sont ouvertes et massivement disponibles — si vous en connaissez, n’hésitez pas à partager l’information, elle intéressera sûrement l’équipe qui cherche toujours à améliorer l’évaluation de son impact !
***
A partir de février, l’équipe sera menée par Benoît Queyron, agent public du ministère chargé des Transports, qui a été formé pendant les 6 derniers mois par les équipes de beta.gouv.fr pour gérer la plateforme. L’équipe actuelle (Nicolas Berthelot, Miryad Ali, Thibaut Barrère et Francis Chabouis) restera de la partie en rejoignant la Fabrique numérique du ministère de la Transition écologique. Dans les prochaines années, l’équipe transport.data.gouv.fr continuera à opérer la plateforme, à mettre à jour les bases nationales et à améliorer les jeux de données en ligne. Ainsi, avec ce service, le ministère chargé des Transports se dote d’une véritable infrastructure publique numérique, comme nous l’appelions de nos voeux avec l’expert des mobilités de l’Ademe Gabriel Plassat en 2019.
Vous pouvez continuer à suivre l’actualité du service sur leur compte Twitter, vous abonner à la lettre d’information en inscrivant votre adresse électronique sur la page d’accueil de transport.data.gouv.fr.
Et nous vous donnons rendez-vous le vendredi 5 mars 2021 (inscriptions ici), pour célébrer ensemble (en ligne) le passage du “bébé” transport.data.gouv.fr au ministère chargé des Transports.