Bannière de la cartothèque.
Les données numériques



Dans le cadre de vos études universitaires, on vous demande des données sur le climat de l'Inde, l'élevage en France, la Bourgogne ou le Cameroun, la pyramide des âges et le taux de natalité dans certains pays, pour un exposé, un dossier, un poster ou pour réaliser des cartes, qu'elles soient faites à la main ou sur un logiciel de SIG. Votre première tendance sera certainement d'interroger Internet par le biais de votre navigateur favori. Vous obtiendrez des millions de sites dont peu vous donneront satisfaction. Essayez car rien ne vaut d'expérimenter par soi-même.

Le bon réflexe serait de consulter des bases de données. D'abord, une précision. Des données comme le taux de parcelles irriguées en Californie ou le nombre de chômeurs en Savoie ne sont pas nées avec l'informatique. On les collectait et les rassemblait dans des rapports, annuaires, fiches de synthèse, atlas et autres supports papier. Comme aujourd'hui, il fallait savoir chercher dans cette abondante documentation pour mettre la main sur les informations dont on avait besoin.

La grande différence par rapport à cette époque (non pas de dinosaures mais d'il y a peine quelques décennies), c'est que l'accès aux données peut désormais se faire sans bouger de son écran. Pour le reste, conception des mesures et mise au point des indices, collecte, uniformisation des données, procédures de recherche et de tri, communication entre bases de données, archivage, rendu des données sur des supports variés, la gestion n'est pas fondamentalement différente. Quant au contenu, il nécessite les mêmes capacités d'analyse et de critique : qui collecte les données, pourquoi ces donnnées et pas d'autres, qui les présente, dans quel dessein et plus généralement : que signifie le recours systématique à des données statistiques pour comprendre le monde actuel ?

Autre précision très importante : toutes les données ne sont pas dans les bases de données informatisées. Toutes les données informatisées ne sont pas en ligne. Les données en ligne ne sont pas toutes accessibles (accès payant, accès confidentiel etc.). Bref, le monde ne se réduit pas aux milliards de données rassemblés dans des sites internet et gérés par les algorithmes de Google (heureusement).

Les bases de données décrites ici ont été demandées aux enseignants de géographie. Elles font d'ailleurs partie de leur bibliographie. Elles sont spécialisées soit sur un sujet soit sur un espace géographique. Ces bases de données se trouvent dans des sites internet et ont un point commun. Elles présentent toutes une page d'accueil "encombrée" avec de nombreux accès, actualités, rubriques, menus qui tranchent avec la simplicité de la page d'accueil de Google.

Pages d'accueil de l'Insee et de Google. Cliquez pour agrandir et découvrez en rouge tous les éléments "cliquables" et en vert l'espace de recherche.



La zone de recherche est centrale dans Google, reléguée dans un coin pour l'Insee. Cette analyse pour que vous preniez conscience d'un fait primordial :
il est normal de se sentir complètement perdu quand on aborde une base de données en ligne.

Réfléchissons plus loin. Vous abordez une base de données en ligne avec une question. Or on vous présente immédiatement un monceau d'informations que vous n'avez pas demandées. On pourrait rêver d'un Accueil pour simple utilisateur (différent de l'accueil pour professionnel) aussi dépouillé que celui de Google et capable de traiter le langage naturel. En attendant, plongeons dans le vif du sujet sur quelques sites en essayant au maximum de simplifier.

Les données numériques - suite