Les cartes à puces des passes de transport sont une mine d’informations. Le projet de recherche Mobilletic a analysé pendant trois ans les données du passe KorriGo, à Rennes. L’expérience met en lumière l’utilité de la big data pour les acteurs publics, notamment en ce qui concerne la planification.
Cinq Exabytes. C’est le volume d’informations créées depuis la naissance de la civilisation jusqu’en 2003, selon Éric Schmidt, le patron de Google. « Cette même quantité d’informations est maintenant créée tous les deux jours! Et ce délai ne cesse de se réduire à mesure que l’information augmente », affirmait-il en 2010 lors de la conférence Techonomy.
Parmi ces données, celles recueillies par les cartes à puce des passes de transports. Comment les recueillir, les analyser et les optimiser? « Ce type de données était utilisé pour la tarification et la lutte contre la fraude, explique Latifa Oukhellou, directrice de recherche à l’Institut français des sciences et des technologies des transports, de l’aménagement et des réseaux (Ifsttar). Mais nous nous sommes rendu compte qu’elles étaient très précises sur les plans temporel et spatial et qu’elles pouvaient servir à autre chose, à l’étude de la mobilité dans les transports en commun, par exemple. »
Mené en partenariat avec l’Ifsttar, l’École des Ponts ParisTech, le Centre d’études et d’expertise sur les risques l’environnement la mobilité et l’aménagement (Cerema), l’opérateur de transport Keolis et Rennes métropole, le projet Mobilletic analyse, depuis mars 2014, les données du passe KorriGo, à Rennes. La cas d’étude n’a pas été choisie par hasard, puisqu’elle a été la première collectivité en France à avoir décidé de libérer les données publiques (open data) issues, notamment, de son réseau de transport. Une ligne de métro, 135 lignes de bus, plus de 1 400 stations. Le volume des données est colossal: la date, l’heure, la ligne et le sens de la validation à la montée sont analysés. « L’identifiant des usagers a été anonymisé, mais nous disposons du type d’abonnement pour chaque carte: jeune, adulte, gratuité, poursuit Latifa Oukhellou. Seules les données de l’origine du déplacement sont disponibles, puisque l’usager valide son ticket uniquement à la montée. Mais nous avons été capables de reconstituer 70 % des trajets avec l’identification des correspondances et des destinations. »
Mobilletic utilise ainsi les données massives (big data) pour comprendre la mobilité et l’intermodalité. Avec son équipe, Latifa Oukhellou a déterminé les profils temporels types des voyageurs selon leur temps de validation dans les transports. « Nous nous attendions à certains usages routiniers, comme l’affluence du matin, du midi et du soir. Mais d’autres nous ont surpris: il y a, par exemple, une fréquentation plus diffuse aux alentours de 10 h, attribuée aux retraités. »
L’objectif, pour l’opérateur et les collectivités, est de comprendre la demande pour adapter l’offre et être ainsi plus réactif. « Actuellement, le plan de transport d’un réseau est prévu longtemps à l’avance. Si l’on saisit les mécanismes de façon plus dynamique, nous pourrions être plus réactifs et injecter davantage de trains et de bus, vers 10 heures par exemple, et être ainsi capables d’adapter l’offre à la demande de mobilité », précise la directrice de recherche.
En mesurant l’influence d’un pôle d’échange, en connaissant le comportement de l’usager, le big data serait ainsi une aide à la construction et au dimensionnement des offres de transport: pertinence des itinéraires, localisation des stations, fréquence des passages. La donnée massive pourrait aussi servir à l’exploitation des modes de transport en connexion (vélos, taxis, autopartage).
Le projet Mobilletic a aussi confirmé l’utilité de certaines politiques publiques. En 2012, face à la période d’hyperpointe qui saturait la ligne de métro rennaise tous les matins, l’université de Rennes 2 a décalé les cours d’un quart d’heure. « Nous avons évalué cette mesure d’un point de vue financier, explique Evelyne Reeves, responsable du Bureau des temps à Rennes Métropole. Nous avons ainsi économisé 12 millions d’euros. Mais l’étude a calculé les effets de cette décision différemment, d’un point de vue individuel, en considérant l’effet du décalage selon le jour de la semaine. »
Le Bureau des temps, qui travaille sur l’organisation des rythmes sur le territoire, s’efforce de déterminer les profils d’usagers. Et si aucun outil ne permet encore d’analyser les données de la billettique, ce dernier envisage de s’inspirer des grilles de données mises en place par Latifa Oukhellou et son équipe. « Cela confirme le potentiel des données de masse, conclut-elle. Le big data est un outil formidable pour agir sur le territoire. » Pour aller plus loin, les données billettiques doivent pouvoir être croisées avec d’autres informations. Les enquêtes lancées par les opérateurs de transport, par exemple, sont une photographie très précise de la mobilité, car elles se basent sur des métadonnées riches: catégorie socioprofessionnelle du voyageur, motifs de déplacements… « Nous travaillons également au croisement de données de mobilité avec les données du territoire: quelles sont les zones d’emploi, les zones d’habitation, la localisation des commerces et des services, avance Latifa Oukhellou. Associer les sciences de la donnée aux sciences humaines pour aborder l’analyse de la mobilité urbaine est un défi méthodologique immense! »
