Questions fréquentes

Données ouvertes

Les données ouvertes, qu'est-ce que c'est ?

Il s'agit plus précisément de données :

  • que les services publics ont collectées dans le cadre de leurs marchés publics ;
  • qui ne contiennent pas (plus) d'informations sensibles sur le plan de la vie privée ;
  • qui ne sont pas protégées par des droits de propriété intellectuelle ;
  • qui sont publiées dans un format facile à utiliser de façon automatique ;
  • qui peuvent être réutilisées à des fins commerciales et non commerciales.

Dans ce cadre, il faut limiter le plus possible les restrictions de réutilisation, notamment à l'aide de normes ouvertes et de licences ouvertes.

L'objectif de l'Open Data est que les réutilisateurs puissent trouver facilement les données, qu'elles soient réutilisables et que l'on n'impose pas inutilement des restrictions ou des conditions à remplir avant l'utilisation des données. Ce concept d'ouverture est crucial pour l'interopérabilité. L'interopérabilité désigne la capacité de plusieurs systèmes et organisations à coopérer. Dans ce cas, il s'agit de la possibilité de combiner plusieurs ensembles de données (datasets). L'interopérabilité améliorera significativement la possibilité de combiner plusieurs datasets et permettra de ce fait de développer plus de produits et de services de meilleure qualité.

Quel sont les avantages pour les citoyens ?

La transparence des pouvoirs publics est un prérequis à la participation citoyenne, aux débats sociétaux d'informations correctes qu'ils peuvent utiliser pour analyser des choix politiques, examiner des faits, développer des opinions. Comme les pouvoirs publics ne savent pas toujours ce qui est pertinent pour le citoyen, les données brutes doivent aussi être mises à disposition. Organisations, citoyens, entreprises. peuvent ainsi générer eux-mêmes des informations pertinentes et participer activement au développement de solutions créatives.

Quel sont les avantages pour l'économie ?

Les bénéfices économiques totaux qui peuvent découler de la mise à disposition de données publiques peuvent s'élever, selon la Commission européenne, à 40 milliards d'euros par an. Le potentiel économique ne réside pas seulement dans la réutilisation d'informations du secteur public pour de nouveaux produits et services, mais aussi dans des gains d'efficacité dans les services publics. Pour la Belgique, le bénéfice net potentiel issu de l'ouverture de données publiques se chiffrerait à 900 millions d'euros, selon les estimations de la fédération sectorielle de l'industrie technologique Agoria. (année 2013)

Quel sont les avantages pour les pouvoirs publics ?

Augmentation de la qualité des données : l'Open Data peut entraîner une amélioration de la qualité des données, car le service public est encouragé à améliorer la qualité de ses propres données avant de les rendre publiques par des mécanismes de feedback.

Renforcement de la légitimité : la légitimité de l'organisation est renforcée puisque les informations dont l'organisation a la gestion sont utilisées à d’autres fins.

Ouverture accrue des administrations sur l'extérieur : en optant pour une stratégie “Open Data”, une administration est incitée à regarder vers l'extérieur et à collaborer davantage avec des partenaires externes.

Avantages de normalisation : si le nombre de données exploitées selon des normes (ou vertes) augmente, d'autres acteurs publics peuvent aussi les réutiliser plus facilement, ce qui accroît l'interopérabilité des services publics.

Publier des jeux de données

Quelles organisations doivent publier des données ouvertes ?

La Loi relatif aux données ouvertes et à la réutilisation des informations du secteur public, article 2, 1°:

  • l'Etat fédéral;
  • les personnes morales de droit public qui dépendent de l'Etat fédéral;
  • les personnes, quelles que soient leur forme et leur nature qui
    • ont été créées pour satisfaire spécifiquement des besoins d'intérêt général ayant un caractère autre qu'industriel ou commercial, et
    • sont dotées d'une personnalité juridique,
    • et dont soit l'activité est financée majoritairement par les instances publiques ou organismes mentionnés au a) ou b), soit la gestion est soumise à un contrôle de ces instances ou organismes, soit plus de la moitié des membres de l'organe d'administration, de direction ou de surveillance sont désignés par ces instances ou organismes;

De quelles données s'agit-il précisément ?

Selon le principe "ouvert par défaut", toutes les données sont des données ouvertes sauf s'il existe une raison valable de ne pas les mettre à disposition (par exemple si les données comprennent des informations sensibles au niveau de la vie privée).

Voici quelques exemples:

  • considérés comme données ouvertes : chiffres du budget, statistiques de population, mesures de la qualité de l'air, glossaires explicatifs
  • non considérés comme données ouvertes : déclarations fiscales individuelles, annuaires téléphoniques achetés dont les autorités ne sont pas propriétaires

Les (ré)utilisateurs doivent-ils s'enregistrer ?

Le point 2 de la stratégie fédérale open data (« Mise à disposition pro-active ») prévoit qu'aucunes formalités supplémentaires (par exemple l'enregistrement obligatoire) ne peuvent être imposées aux citoyens ou entreprises qui souhaitent consulter ou réutiliser des données.

Cela signifie que les utilisateurs doivent pouvoir télécharger des ensembles de données sans qu'une page de connexion ou une fenêtre contextuelle ne s'affiche.

Et c'est logique : les visiteurs de sites web publics ne doivent pas non plus s'enregistrer ou s'identifier afin de pouvoir télécharger des brochures au format PDF ou de consulter des informations à caractère non personnel.

Quelle licence s'applique ?

L' AR du 2 juin 2019 relatif à la réutilisation des informations du secteur public(link is external) suit une logique en cascade pour les jeux de données fédérales.

La "licence ouverte" (déclaration CC0) qui permet la réutilisation gratuite des données à des fins commerciales et non commerciales est d'application là où c'est possible. Si ce n'est pas le cas, cela doit être explicitement motivé par le service public concerné (principe `comply or explain').

  • Par défaut - Pas de condition = domaine public = Creative Commons Zero (CC0)
  • Condition " mentionner la source " = attribution = licence CC-BY + motivation
  • Condition " redevance " = modèle de licence " Réutilisation contre paiement " + motivation détaillée.
  • Conditions spécifiques = modèle de licence sur mesure à définir par l'autorité publique + motivation détaillée.

Où sont publiés les ensembles de données (fichiers) ?

Le portail data.gov.be contient uniquement des liens vers des fichiers de données ouvertes et ne permet actuellement pas d'enregistrer des fichiers de données ouvertes. Les services publics se chargent eux-mêmes d'enregistrer et de gérer les fichiers de données ouvertes, de préférence sur leurs propres sites web. Si les fichiers sont répartis entre plusieurs pages, il est conseillé de créer également une page d'aperçu comprenant une liste des fichiers (et/ou des liens vers les pages où ils se trouvent).

Si les fichiers sont relativement grands, ou si on prévoit qu'ils seront souvent téléchargés, il est conseillé de les placer sur un serveur distinct.

A propos du portail

Comment sont sélectionnés les jeux de données ?

Les services publics détenteurs de données collectées pour les besoins de leurs missions légales doivent en permettre une réutilisation maximale par les citoyens, les chercheurs, les entreprises ou d'autres autorités, Les ensembles de données ouvertes sont mis à disposition dans un format facilement éditable automatiquement. Selon les moyens dont ils bénéficient ces services mettent à disposition les datasets les plus utiles et les plus susceptibles d’être réutilisés.

Comment arrivent (les liens vers) les jeux de données sur ce portail ?

Afin d'éviter les doubles emplois et de maintenir les données le plus à jour possible, on recourt au maximum à l'automatisation. On ne procède dès lors à aucune saisie manuelle sur le portail lui-même, l'objectif étant que les (liens vers les/les données relatives aux) ensembles de données soient automatiquement repris des sites web des services publics.

Ce portail fédéral intègre déjà des données provenant d'une série d'autres portails (également régionaux) : les ensembles de données qui sont déjà repris sur un de ces portails sont dès lors automatiquement mentionnés sur le site data.gov.be. Par ailleurs, le portail ne regroupe que les liens et les métadonnées. Les fichiers eux-mêmes ne sont pas copiés. Si les ensembles de données ne sont pas encore décrits sur l'un des autres portails, les métadonnées peuvent être fournies de différentes manières :

  • La meilleure façon est de placer un fichier de métadonnées à un endroit fixe sur son propre site web, de préférence au format européen DCAT-AP, avec des références aux ensembles de données.
  • Certaines plates-formes ont un service web/une API permettant de demander des métadonnées de manière structurée.
  • Il est aussi possible de créer sur son propre site web (solution provisoire) une page reprenant un aperçu des fichiers de données ouvertes. Moyennant les accords nécessaires, la page peut alors être « scrapée » par les outils développés à cette fin par la DG TD du SPF BOSA.

Quelles données supplémentaires (métadonnées) sont nécessaires ?

Afin de publier des ensembles de données de manière claire, les données suivantes sont nécessaires :

  • l'organisation qui publie les ensembles de données
  • point de contact pour les réutilisateurs (il peut s'agir d'une boîte de messagerie générale)
  • code unique linguistiquement neutre
  • titre et brève description
  • lien(s) direct(s) vers le(s) fichier(s) téléchargeable(s)
  • page d'aperçu où l'on peut trouver plus d'explications
  • licence
  • format du fichier

Les données utiles supplémentaires sont :

  • mots-clés
  • la fréquence à laquelle les jeux de données seront mis à jour
  • date de la dernière modification
  • période sur laquelle portent les données

Pourquoi certains jeux de données ne sont-ils pas encore disponibles ?

Comme les volumes de données sont énormes, un certain laps de temps peut s'écouler avant qu'un jeu de données déterminé puisse être offert au format correct et être utilisable. La directive européenne et les lois belges autorisent des exceptions telles que les données couvertes par la protection des données personnelles et les informations concernant la sécurité nationale par exemple. Le formulaire de contact permet de poser des questions ou de formuler des suggestions sur les ensembles de données qui font encore défaut sur ce portail.