Blog ENI : Toute la veille numérique !
-25€ dès 75€ sur les livres en ligne, vidéos... avec le code FUSEE25. J'en profite !
Accès illimité 24h/24 à tous nos livres & vidéos ! 
Découvrez la Bibliothèque Numérique ENI. Cliquez ici
  1. Livres et vidéos
  2. Open Data
  3. Exposer de la donnée publique
Extrait - Open Data Consommation, traitement, analyse et visualisation de la donnée publique
Extraits du livre
Open Data Consommation, traitement, analyse et visualisation de la donnée publique
1 avis
Revenir à la page d'achat du livre

Exposer de la donnée publique

Objectif

Le but du présent ouvrage est de présenter l’Open Data sous le prisme de la consommation par un public averti, sans toutefois être expert de l’analyse de données (datajournalistes en herbe, citoyens intéressés et avec des connaissances informatiques, etc.), voire d’amener quelques personnes sans connaissances préalables à cet état "averti". L’approche d’une relation à la donnée inversée, à savoir celle en lien avec sa production et non sa consommation, est un sujet suffisamment complexe pour justifier un livre à elle seule, mais il a paru intéressant à l’auteur du présent ouvrage de fournir quelques humbles pistes à des personnes intéressées par cet aspect. Le fait d’avoir parcouru longuement de nombreux portails à la recherche de jeux de données, de les avoir souvent nettoyés et "fait parler" constitue en effet un retour d’expérience potentiellement utile pour construire un prochain portail plus facilement utilisable. Sur certains sujets hors de sa compétence, l’auteur se contentera toutefois de souligner l’importance de bien le prendre en compte sur un projet d’exposition de données, sans pouvoir émettre de recommandation plus précise.

Préparer un projet Open Data

1. Détermination de l’objectif

Il n’est pas de projet réussi si les objectifs ne sont pas clairement définis en amont. Ce qui paraît évident ne l’est malheureusement pas toujours, et des projets Open Data sont parfois lancés pour des raisons d’affichage, de communication, sans que les buts ne soient clairement posés. La donnée est-elle destinée à un consommateur immédiat ? Aux services internes de l’entité ? Aux touristes ? Aux entreprises ou ménages souhaitant s’installer dans l’entité géographique concernée ? Tous ces points doivent bien sûr être clarifiés le plus en amont possible d’une quelconque réalisation, sous peine de gaspillage de temps et d’énergie, sans compter les ressources informatiques.

C’est un retour commun à toutes les collectivités interrogées qu’un objectif clair et des soutiens au plus haut niveau sont nécessaires pour qu’un projet Open Data aboutisse, et encore plus de soutien pour qu’il soit un succès. Mais comment déterminera-t-on si le projet a été un succès ? À nouveau, il convient de se poser cette question à l’avance. Il s’agit d’ailleurs d’un révélateur du réalisme des objectifs. Si aucune condition pour déclarer la réussite ou l’échec n’est déterminée, le projet a de bonnes chances de dépérir assez vite ou de végéter. Si, à l’inverse, une condition de succès est claire et mesurable, alors le chemin vers l’objectif sera au moins visible, même si cela ne le rendra pas plus facile en soi.

Cette notion de mesure du succès doit par ailleurs être manipulée avec précaution car quelques indicateurs pris au hasard ne suffiront pas à établir un diagnostic indiscutable. Ainsi, le taux de fréquentation du portail Open Data est un indicateur intéressant mais qui ne peut être utilisé seul. Un pic de curiosité au début de la campagne de communication sur le lancement du portail est toujours observé mais il est intéressant de voir...

Exécution du projet

Les étapes préparatoires prises en compte, la mise en œuvre à proprement parler peut commencer. L’enchaînement d’étapes nécessaires dépendra de chaque projet, mais quelques points de discussion émergent souvent. Les sections ci-dessous abordent quelques-uns de ces sujets, en fournissant des pistes de solutions.

1. Gestion de la donnée

Le gros de la problématique du portail porte sur l’exposition des sources. Après tout, il s’agit de la responsabilité principale du serveur, ce qui explique qu’un serveur web soit quasi systématiquement utilisé (rares sont les dépôts de donnée ouverte sur FTP, par exemple). L’exposition sera le premier point de jugement, voire le seul, de l’internaute sur le portail Open Data.

a. Choix des sources

Le choix des données qui seront exposées est, évidemment, éminemment stratégique. Il est bien entendu guidé par le contexte politique d’exposition et les objectifs qui ont été fixés au projet.

Le choix des sources peut être guidé par des critères techniques, politiques, légaux, d’opportunité ou simplement économiques. Tous ces critères s’entremêlent bien sûr, et rendent les arbitrages nécessaires. Reprenons-les un par un pour bien expliquer en quoi ils influent sur le choix final :

  • Le critère technique commande de ne pas exposer de données qui ne sont pas propres, ou disponibles seulement dans des formats difficilement exploitables. Par exemple, si une source de données n’est disponible que dans un format PDF, il faut réfléchir à l’opportunité de la publier. Si le but est uniquement la transparence, alors le format PDF peut suffire. Mais si l’exploitation nécessite le moindre calcul (comparaison, etc.), alors il peut se révéler plus avisé de surseoir à la publication de la donnée tant qu’elle n’a pas été extraite sous un format plus propre à manipulation. Si la source initiale de données n’est plus accessible et que seuls les fichiers PDF restent, une approche peut également être de favoriser l’extraction...

Quelques outils

En fonction de l’ambition du producteur, un site Open Data peut être réalisé au choix avec quelques briques technologiques très simples ou bien nécessiter une architecture complexe. S’il ne s’agit que de mettre à disposition quelques fichiers Excel, un simple serveur web avec une grande bande passante et de bonnes performances d’entrées/sorties peut tout à fait faire l’affaire. Si par contre le but est de fournir un accès ergonomique à la donnée et de supporter une exposition normative, l’investissement sera bien sûr supérieur, tout en restant raisonnable par rapport à des projets de type ERP ou ESB, qui sont beaucoup plus structurants dans un Système d’Information.

De nombreuses collectivités réalisant de l’Open Data ont un service informatique avec des moyens assez limités et en général déjà bien occupés par le maintien en condition opérationnelle des dizaines, voire centaines, de logiciels utilisés par les agents. Le choix se porte donc souvent sur des solutions packagées, voire disponibles en ligne. Sans prétendre à une quelconque exhaustivité, nous listerons ci-dessous quelques approches possibles.

1. Frameworks

Au lieu de créer un site web à partir de composants informatiques standards, il est possible d’utiliser des frameworks, c’est-à-dire des ensembles de composants, qui sont spécialement assemblés pour traiter de l’Open Data. Une liste est disponible sur http://wiki.civiccommons.org/Data_Platform/, et nous expliquerons un peu plus en détail ci-dessous les fonctionnalités deux des plateformes les plus utilisées.

a. CKAN

CKAN (pour...