Espace de partage de mes humeurs, rumeurs, primeurs et clameurs professionnelles :)
Le principe de l’Open Data énoncé il y a quelques années déjà, poursuit son processus d’assimilation à l’échelle mondiale et beaucoup d’organisations internationales, de gouvernements nationaux et locaux, de compagnies privées, etc., ont mis à disposition publique les données qu’elles produisent, recueillent, maintiennent et utilisent dans le cadre de leurs activités. Ceci pour être en conformité avec cette philosophie qui veut que ces données soient disponibles pour accès et réutilisation par les citoyens et par les entreprises. Ces données qui ont fini d’être exponentiellement numériques, foisonnent dans les réseaux et autres entrepôts visibles ou « cachés » du Web, nécessitant tout un ensemble de procédés, de techniques et technologies, de normes, etc. pour les gérer en les rendant accessibles et donc utiles. Un impératif de gestion dont ne sauraient se départir les professionnels de l’info-doc, ne serait-ce que par leur activité de médiation entre ces données et les utilisateurs finaux. Ce billet se propose d’être un petit exemple de ce qu’est ce rôle, en fournissant un petit panorama de sources de données disponibles sur le Web. Des sources non exhaustives loin s’en faut, mais qui donnent une idée sur l’ampleur des données actuellement disponibles et qui doivent faire le bonheur de tout analyste engagé ou non dans une activité de recherche ou de production intellectuelle. Cette compilation pour les apprenants et chercheurs de notre institution, surtout ceux qui participent au cours sur l’analyse des données, est une contribution à notre politique interne de maîtrise de l’information (Information Literacy), dont la « maîtrise des données » (Data Literacy) et la « maîtrise statistique » (Statistical Literacy) sont des composantes importantes.
La liste est subdivisée en quatre catégories comprenant ce que j’appelle :
Les Concentrateurs de sources de données, identifiés comme étant des sites fédérant des données issues de diverses sources,
Les Sources de données d’organismes internationaux, grands producteurs de données couvrant tous les pays et toutes les disciplines
Les Sources de données gouvernementales et nationales, c’est-à-dire tout ce qui est produit et utilisé à l’échelle d’un pays par les organismes officiels publics. Il y a une cinquantaine de pays concernés, toutefois j’ai voulu juste m’intéresser aux quelques pays africains qui ont franchi le pas et rejoint le mouvement de l’Open Data.
Les Moteurs de recherche spécialisés, sans qui il serait très difficile de faire une recherche ciblant spécialement les données et se prémunir ainsi d’un « bruit » assourdissant si on utilisait les moteurs de recherche généralistes classiques
Concentrateurs de données
DataMarket : Plusieurs données gratuites classées thématiquement
Infochimps : Robuste collection de jeux de données classés par catégorie. Cependant le processus de monétisation de leur Big data est en cours
Dataprovider : Exploration de millions de Pages Web et structuration des données brutes récoltées
DataHub : Plateforme gratuite de gestion de données de Open Knowledge Foundation. Des Milliers de jeux de données disponibles
Google Public Data Explorer : Collection de données publiques et leurs sources de Google
Freebase : Agrégateur de données de type communautaire où les membres partagent leurs données et visualisations, etc.
Data Publica: Catalogue français de données ouvertes qui propose en plus un lexique sur les données
Socrata : référentiel de différents types de jeux de données
Knoema: Fournit un atlas mondial de données exposant des profils statistiques et autres données par pays
Public Data Sets/Amazon Web Services : Amazon propose un petit nombre de jeux de données dû à leur taille plusieurs Gigabits et même Térabits
Index Mundi : Profils par pays très détaillés : Statistiques, graphiques, cartes, provenant de sources multiples
Sources de données d’organismes internationaux
Data Portal European Union : Hub de données ouvertes de l’Union Européenne
Eurostat Home : Agence Statistique de la Commission européenne
Open Data for Africa : Données fournies par la Division des statistiques de la Banque Africaine de Développement
Data and maps (EEA) : Données partagées par l’Agence Européenne pour l’environnement
UNdata : Hub de données ouvertes des Nations Unies
IMF Data and Statistics : Sources de données du FMI
Data World Bank : Données de la Banque mondiale
World Bank Projects Evaluations : Evaluation des projets financés par la Banque mondiale
OECD.Stat : Sources de Données de l’OCDE
ESPON Database Portal : Données de l’Observatoire en réseau de l’aménagement du territoire européen
MDG Indicators : Site des Nations Unies des indicateurs des OMD
Afristat : Observatoire Economique et Statistique d’Afrique Subsaharienne
ASTI : Données agricoles sur les pays en développement
WGI Project : Indicateurs sur la gouvernance mondiale (WGI) présente des indicateurs pour 215 économies sur la période 1996-2012 et sur 6 dimensions de la Gouvernance.
Sources de données gouvernementales et nationales
Un certain nombre de pays rendent publiquement accessibles leurs données gouvernementales, une trentaine identifiées dont 4 pays africains qui sont :
Ghana : Portail des Données ouvertes du Ghana
Kenya : Portail des données ouvertes du Kenya
Maroc : données publiques de l’administration marocaine :
Tunisie : Plateforme expérimentale d’ouverture des données publiques tunisiennes
Mais aussi les plages spéciales par pays dans la plateforme OpenData for Africa de la Banque africaine de développement, exemple de l’Afrique du Sud et du Projet de curation des données par pays pour toute l’Afrique.
Moteurs de recherche spécialisés
Quandl : Recherche sur plus de 3 millions de jeux de données financières, économiques et sociales
Zanran : moteur de Données numériques et Statistiques
Et ci-dessous une version sous forme de présentation téléchargeable.
Commentaires récents