Répertoire SIRENE de l’INSEE : les données sur 10 millions d’établissements maintenant disponibles en open data
Conformément aux dispositions de la loi pour une République numérique, l’Institut national de la statistique et des études économiques a publié ce jour la base SIRENE en open data sur le portail data.gouv.fr. Cette ouverture représente une avancée majeure en matière d’ouverture des données publiques. Cette base, qui comprend près de 9 millions d’entreprises et 10 millions d’établissements, a vocation à intégrer prochainement le service public de la donnée. Vous pouvez maintenant télécharger l’intégralité de la base, les mises à jour quotidiennes, ainsi que la documentation associée.
« Le répertoire SIRENE » : la plus grande base de données existante sur l’état-civil des entreprises
Le répertoire SIRENE rassemble des informations économiques et juridiques relatives à environ 10 millions d’entreprises et d’établissements, quel que soit leur secteur d’activité, situés en métropole ou dans les départements d’outre-mer. En moyenne, 10 000 modifications par jour sont enregistrées dans le répertoire. L’INSEE travaille avec de nombreux organismes, comme les greffiers des tribunaux de commerce, qui récoltent les informations sur les immatriculations, les radiations et les modifications au répertoire. Les données de la base SIRENE, parmi les plus complètes au monde, comprennent des données d’identification et des données économiques essentielles, notamment :
- L’adresse des établissements et leur statut juridique;
- Le numéro SIRET/SIREN : Le numéro SIREN est le numéro d’identification unique attribué à chaque entreprise par l’INSEE, ce numéro sert à identifier la personne juridique de sa création à sa dissolution. Le numéro SIRET est attribué à chaque établissement, il est composé du numéro SIRET de l’entreprise et un numéro interne de classement (NIC). Avec ces deux codes, tous les établissements en France sont identifiés;
- Le code APE : Toute entreprise et chacun de ses établissements possède un code caractérisant son activité principale par référence à la nomenclature d’activités française Ce code permet des statistiques très précises sur la répartition des secteurs en France;
- La base de données des effectifs par tranche pour les entreprises et les établissements…
Un impact économique majeur
Tous les acteurs, privés (entreprises, associations…) comme publics (administrations, collectivités territoriales…) peuvent ainsi accéder gratuitement à ces données. L’ouverture de ce répertoire enrichit la liste des données déjà mises en open data par l’INSEE, qui compte parmi les plus grands fournisseurs de données sur data.gouv.fr, ainsi que d’autres sources de données relatives aux entreprises (Boamp, Bodacc et Balo), données INPI (marques, brevets et dessins), données Infogreffe…).
Mi-novembre 2016, le Hackathon #OpenSirene organisé avec l’INSEE avait permis de préparer cette ouverture et d’identifier de premiers exemples de réutilisations des données.
L’impact économique attendu s’annonce majeur grâce aux externalités positives associées à cette ouverture : mise à disposition de données pivot, fiabilisation d’études et d’estimation de potentiels de marché, efficacité des politiques publiques…
En ouvrant ces données, la France honore ses engagements pris dans le cadre de la Charte Open Data du G8, et pourrait ainsi devancer – grâce à la qualité et à la complétude de la base – le groupe des pays les plus en pointe ayant déjà ouverts leurs registres des entreprises, dont le Royaume-Uni, l’Australie, l’Indonésie, la Norvège ou la Roumanie. Plus largement, de nombreux exemples démontrent les effets attendus [1] d’une plus grande ouverture des données publiques:
- une progression très nette de la réutilisation des données, tant en nombre et diversité de réutilisateurs que de fréquence d’usage. En France, le passage à la gratuité du Référentiel à grande échelle de l’IGN pour les acteurs chargés d’une mission de service public s’est traduit par une multiplication par 20 de l’usage des données,
- un rapport coûts / bénéfices très favorable, tant pour le secteur public que privé – de 1 à 13 pour les données géo spatiales australiennes, parmi les premières à être ouvertes dès 2006,
- une dynamisation du marché aval des services fondés sur les données, avec l’apparition de nouveaux acteurs et une incitation plus forte à innover pour les acteurs historiques. Aux Etats-Unis, la décision du National Oceanic and Atmospheric Administration (NOOA) d’ouvrir leurs données a permis la création d’une industrie météorologique qui pèse aujourd’hui plusieurs milliards de dollars dans l’économie américaine [2],
- une réduction des coûts de transaction et de l’asymétrie d’information dont les bénéfices concernent tout autant les acteurs publics que privés. Le Danemark a ainsi calculé que 70% des bénéfices de l’ouverture des données d’adresses revenaient au secteur privé et 30% au secteur public, pour un retour sur investissement de 14 millions € de bénéfices contre un coût de 0,2 million € en 2010 [3],
- une lutte accrue contre la corruption et la fraude fiscale par la réduction des asymétries d’information. Au Canada en 2010, une fraude fiscale de 3,1 milliards de dollars a pu être identifiée grâce aux données ouvertes [4]. En Ukraine, une fraude d’un 1.8 milliards de dollars a également été détectée [5].
[1] Voir « Open Data for Economic Growth » (World Bank, 2014) et « The Generative Mechanisms of Open Government Data » (Jetzek Thorhildur, 2013), « Cost and benefits of data provision » (Victoria University, 2011).
[2] http://www.nytimes.com/2008/07/07/business/media/07weather.html?_r=0
[3] http://www.adresse-info.dk/Portals/2/Benefit/Value_Assessment_Danish_Address_Data_UK_2010-07-07b.pdf
[4] http://eaves.ca/2010/04/14/case-study-open-data-and-the-public-purse/
[5] http://rue89.nouvelobs.com/2015/11/02/demandez-a-quoi-sert-lopen-data-allez-voir-ukraine-261916
Source : ADEC - Open data