Open Data : show me the money !
Quatre ans après les premières démarches d’ouverture des données publiques en France, la question économique reste entière : pourquoi a-t-on toujours autant de mal à déterminer l’impact économique de l’open data autrement qu’à grands coups de milliards de dollars, façon Mc Kinsey ? Où est la start-up qui va révolutionner le monde et qui doit tout aux données ouvertes ?
Le débat sur la valorisation n’est pas nouveau, et les mesures de la valeur de l’open data s’établissent selon deux logiques. Soit c’est la valeur du marché des informations publiques qui est mesurée (par exemple dans le cadre de l’étude MEPSIR de 2006), alors que nombre d’entre elles ne sont pas ouvertes ; soit ce sont les gains d’opportunité qui sont comptabilisés (Mc Kinsey Global Institute).
Suivant cette deuxième logique, les rapports se sont succédés et concluent tous à des montants colossaux. Le plus récent, celui de McKinsey en 2013, situe entre 3 220 et 5 290 milliards de dollars la valeur annuelle de l’open data. À titre de comparaison, le PIB de l’Allemagne, 4ème puissance mondiale, est de 3 747 milliards.
Dans le même temps, les gouvernements ont été nombreux à mettre en place des politiques d’ouverture des données publiques pour des raisons politiques (une gouvernance plus ouverte), économiques (permettre le développement de nouvelles activités qui génèreront des bénéfices économiques pour l’état et la société) ou pour impulser la modernisation de l’action publique.
Cependant, force est de constater qu’aujourd’hui peu d’exemples probants de valeur économique générée par des données publiques ouvertes sont disponibles : où est la start-up qui doit tout à l’open data ? De même, les entreprises ne s’engagent pas de façon très nette dans l’ouverture des données qu’elles détiennent, génèrent ou manipulent, à l’exception de quelques acteurs du secteur des transports et de la mobilité.
Plus encore, on a parfois du mal à comprendre si l’open crée de la valeur pour les données… ou bien en détruit (par les mécanismes de gratuité, etc.).
Quelles raisons expliquent cette difficulté à mesurer l’impact économique et la valeur de l’open data ?
Trois hypothèses
Hypothèse 1 : parce que c’est trop tôt
L’effet retard est une première hypothèse que l’on peut mobiliser pour expliquer notre difficulté à mesurer les impacts économiques. C’est une approche développée notamment dans l’étude réalisée en 2012 par Marc de Vries et Geoff Sawyer pour le compte de l’Agence spatiale européenne. Les deux auteurs distinguent 3 phases dans les effets de l’ouverture des données : une phase d’ensemencement (sowing phase), une phase de culture (growing phase) et une phase de récolte (harvesting phase). Si l’on retient cette approche, il est donc logique de ne pas en voir aujourd’hui les bénéfices économiques, car nous ne serions pas encore entrés dans la phase de récolte…
Hypothèse 2 : parce que c’est trop diffus et/ou compliqué
Dans l’évaluation de la valeur de l’open data, un élément important est souvent peu mis en lumière par les auteurs et les commentateurs, qui explique en partie la difficulté à voir la réalisation des promesses avancées : dans de nombreuses évaluations, (et dans de nombreux cas d’utilisation des données ouvertes), la valeur de l’open data se réalise largement en combinaison avec d’autres données qui, elles, ne sont pas forcément ouvertes, ce qui est appelé généralement le big data.
Selon cette hypothèse, pour que la valeur de l’open data se révèle, la disponibilité et l’utilisation d’autres données est déterminante. Ce n’est pas la seule mise à disposition qui produit l’intégralité de la valeur.
Hypothèse 3 : parce qu’on ne connaît pas bien les réutilisateurs
Cette dernière hypothèse est que les réutilisations de données publiques ouvertes ne sont pas toutes visibles, communiquées ou explicites.
Certaines réutilisations sont particulièrement visibles quand elles sont incarnées par des applications mobiles qui le revendiquent. En revanche, la majorité des réutilisations de données publiques ouvertes n’est pas communiquée à l’extérieur de l’organisation qui les utilise. On mesure donc difficilement ce qui ne nous est pas donné à voir.
Toutefois, des effort sont faits pour mieux identifier et révéler les utilisations. Exemple : le site Open Data 500, qui les recense, et la plate-forme ouverte des données publiques data.gouv.fr, qui permet aux utilisateurs de mettre en ligne les réutilisations qu’ils ont faites des données mises à disposition.
Pistes de réflexion Datanomics : qu’est-ce que l’open fait à la valeur des données ?
Pour tenter d’y voir plus clair dans cette question de la valeur de l’open data, faisons un détour par la valeur des data. Dans le cadre de Datanomics, nous avons identifié une typologie de trois formes de valeur des données : les données comme matière première, les données comme levier et les données comme actif stratégique.
Concentrons-nous ici sur les données comme matière première. Les métaphores habituelles utilisées pour décrire la valeur des données (pétrole, diamant, blé ou l’or) nous ramènent assez vite dans cette conception. On y voit les données comme un combustible qui alimenterait une machine (le pétrole), comme une matière qui prend sa valeur une fois qu’elle est travaillée (le diamant) ou comme un produit qui peut être consommé ou utilisé pour se renouveler (le blé). Les limites de ces comparaisons sont nombreuses : à la différence du pétrole, qui disparaît avec son utilisation, les données peuvent être réutilisées à l’infini. À la différence de l’or, les données ne prennent pas de valeur de thésaurisation.
Un constat s’impose : avec des données ouvertes (dont, par définition, on ne monétise pas la transmission), la valeur monétaire, celle qu’on associe à la donnée comme matière première, est en grande partie liquidée. C’est d’ailleurs l’une des conclusions du rapport Trojette sur les redevances des données publiques, publié en 2013.
Autre raison qui explique la liquidation de la valeur des données avec l’ouverture : la révolution des proxies. Comme de nombreuses sources sont disponibles pour mesurer le même phénomène et qu’une grande partie d’entre elles est accessible gratuitement, la rareté et l’exclusivité des données sont moins assurées : leur valeur monétaire tend à décroître.
Cette explication est confortée par un autre constat concernant les acteurs de l’open data et leur modèle économique. Au démarrage des initiatives d’open data, des acteurs économiques sont apparus avec un positionnement d’”infomédiaire” ou de place de marché de données ouvertes (Infochimps et Data Publica, par exemple). Aujourd’hui, ces acteurs ont abandonné ce positionnement de pur intermédiaire (data broker) pour évoluer vers un positionnement de type service. Ce ne sont pas les données qui sont vendues, mais les services qui permettent de l’exploiter (API, analyse ou visualisation par exemple).
C’est la forme de valeur des données comme levier qui correspond probablement le plus à la valeur de l’open data : elles permettent aux organisations qui utilisent des données ouvertes d’améliorer leur performance, soit en évitant des coûts, soit en développant des revenus par une meilleure tarification ou par de nouvelles ventes.
Vendre ou exploiter ?
Les caractéristiques de la valeur de l’open data sont celles des données en général : la valeur est dans la réutilisation, elle est future et co-construite. Dans la réutilisation, car elle est n’est pas monétisée directement. Future, car la valeur ne se révèle qu’une fois l’utilisation réalisée (elle s’évalue difficilement a priori). Co-construite, car c’est rarement celui qui dispose des données qui peut en révéler toute la valeur.
In fine, l’ouverture des données pose un grand nombre de défis aux acteurs privés : faut-il acter la liquidation de la valeur monétaire des données – c’est-à-dire renoncer à les vendre – pour mieux en exploiter la valeur stratégique et de levier ? Comme nous le disait un responsable d’un grand groupe, par ailleurs largement impliqué dans des démarches open data : “Tant que personne ne fait d’argent avec nos données, cela ne nous pose pas de problème de les ouvrir”.
Louis-David Benyayer et Simon Chignard
Source : Article extrait du livre : Benyayer, L.D., 2015, Open Models, les business models de l'économie ouverte, éditions Without Model
Source : ADEC - Open data