mardi, 19 mars 2024

Un service de GéoRezo

Tag » STATISTIQUE

b.a-ba base

Tous les métiers reposent aujourd’hui sur des applications, et donc des données. Les urbanistes n’en conçoivent que rarement mais ils en utilisent un grand nombre : par exemple en consultant le cadastre ou en utilisant des données extraites de différentes bases de données comme des éléments issus des permis.

Dans certains cas, et notamment pour certaines données SIG ce sont simplement des « couches », c’est à dire des données que l’on superpose les unes aux autres. Mais, de plus en plus, les informations saisies ou consultées sont intégrées et ensuite extraites de systèmes de gestion de base de données, ou SGBD.

 

Quel est l’intérêt de ces données organisées ?

  • optimiser le stockage des données pour limiter éventuellement son poids et sécuriser cette donnée
  • éviter la redondance des données et donc les saisies équivalentes à plusieurs endroits
  • faciliter les mises à jour des données de référence, par exemple modifier un prix unitaire à un seul endroit
  • et faciliter les diverses exploitations, statistiques en particulier.

 

Il existe plusieurs manières d’organiser ces données.

Je n’en citerai que 3 :

  • hiérarchique : qui correspond souvent à l’organisation des pages web avec une page principale (mère) et des pages secondaires qui déclinent cette page principale (enfant)
  • relationnelle : qui est l’organisation majoritaire pour organiser toutes les données métiers, et que nous allons expliciter plus en détail.
  • en étoile : pour des analyses dites décisionnelles, qui correspond à un mode d’organisation facilitant les traitements statistiques à grande échelle.

Retenez que le mode d’organisation dépend de la donnée traitée mais également des usages attendus. Des statistiques, principalement fournies à l’échelle communale et intégrées annuellement, ne nécessitent pas la même organisation que des informations saisies pour instruire un dossier de subvention : dans le premier cas le principal lien entre toutes les tables est le code commune INSEE, dans le second cas il existera des liens plus complexes entre le dossier de subvention et les différentes phases comptables.

La méthode, notamment pour un modèle relationnel, consiste à dessiner un « modèle de donnée » c’est à dire une organisation de celles-ci sous forme de schéma :

  • modèle conceptuel dans un premier temps qui présente les principales relations nécessaires pour répondre aux besoins,
  • logique ensuite, en allant plus loin dans l’organisation des données, les différentes relations et tous les éléments sous-jacents utiles
  • et enfin, physique, c’est à dire complètement adapté à l’outil final : format de la base de donnée et outil d’exploitation. En effet, selon le/les logiciels utilisés l’organisation ne sera pas la même. On peut visualiser ça avec certains formats SIG qui permettent la combinaison de différentes géométries (exemple du format Tab) ou d’autres qui ne le permettent pas comme le Shape.

    Modèle de donnée DDU

    Modèle de donnée DDU

Quelques éléments de terminologie

Les termes utilisés sont importants pour bien comprendre les principes d’organisation des bases de données. Ils sont également nombreux et souvent équivalents, dépendant du domaine d’origine et des outils utilisés.

 

Identifiant unique, UID, IDU, clé primaire … atomique

Cette notion est importante. Il est conseillé, dans une base de données, de bien désigner chaque ligne d’information par un identificateur unique de manière à bien qualifier et distinguer chaque élément et de faciliter le tri et le filtrage des informations. Cela permet également de remonter à un utilisateur ou à une entité spécifique du système très facilement.
https://actualiteinformatique.fr/internet-of-things-iot/lidentifiant-unique-uid

 

Table, fichier

Dans un système relationnel, et quel que soit le « SGBD » utilisé, (Oracle, My SQL, PostGre, …), les différentes informations sont stockées dans des tables. Ces tables correspondent en quelque sorte aux différentes feuilles d’un tableur.

 

Entités, enregistrements, lignes, tuples

Les différents enregistrements d’une table correspondent à des lignes d’information cohérentes. Par exemple la liste des différents zonages dessinés dans un PLU avec ses informations associées.

 

Champs, variables, colonnes, attributs

Ce sont en quelque sorte les informations élémentaires. Par exemple, pour un enregistrement dans une table listant les communes l’information sur le code INSEE.

 

Domaines, listes de valeurs

Ce sont des éléments, stockés en règle générale dans des fichiers, utilisés pour saisir certaines informations de manière accompagnée et normée. Par exemple, ce peut être la liste des communes de manière à proposer celles correspondant au territoire d’intervention.

 

Pour aller + loin :

Vocabulaire base de données : https://fr.wikibooks.org/wiki/Les_bases_de_donn%C3%A9es/Le_vocabulaire_de_base_des_BDD

Wikipédia : https://fr.wikipedia.org/wiki/Base_de_donn%C3%A9es

Entité : https://www.base-de-donnees.com/entite/

Modèle relationnel/multidimensionnel (étoile) : https://maximilienandile.github.io/2016/10/12/Base-de-donnees-comprendre-les-differences-entre-le-modele-relationnel-et-le-modele-multidimensionnel/

Différents niveaux de modèle : https://louisvandevelde.be/index.php?dos=my&fic=meris

Commission règles et qualité du CNIG : http://cnig.gouv.fr/commission-regles-qualite-r21391.html

 

Qualité raisonnée

Dernière notion importante en matière de base de données, celle de qualité. Celle-ci est essentielle, y compris pour l’utilisateur final :

  • Par exemple s’il existe plusieurs orthographes pour les noms de communes, la recherche pourra être incomplète.
  • De la même manière si une information n’est pas bien classifiée, il sera difficile de produire des analyses pertinentes. Je pense là aux classifications d’occupation du sol qui posent la question du mélange entre morphologie du bâti et usage réel ? exemple d’une maison utilisée comme atelier artisanal
  • On parle aussi de qualité en ce qui concerne les éléments géométriques, un sujet largement porté par le CEREMA et en lien avec la qualification des données, notion qui renvoit à sa description et son catalogage.

Néanmoins, comme dans tout domaine, le principe de réalité conduit à parfois relativiser la tendance à la normalisation qualitative. En effet, comme l’évoque Tetranos dans ses présentations sur la qualité :

  • la qualité s’apprécie au regard d’un besoin
  • ce besoin peut être différent d’un acteur à l’autre
  • la modélisation est toujours un parti pris de représentation de la réalité (carto versus terrain) et de ses informations associées
  • des adaptations sont parfois nécessaire suivant les caractéristiques du Système de Gestion de Base de Données, c’est pour ça que l’on décline le modèle de base, conceptuel, jusqu’au modèle physique, adapté aux outils.

 

Il peut donc être utile de dessiner un modèle, une organisation des données, moins contraint que ce que le concepteur imaginerait au départ. Les règles doivent répondre à des besoins et des utilisateurs et ne pas imposer des contraintes par simple orthodoxie informatique.

Qui n’a pas eu des formulaires à remplir avec des informations « obligatoires » qui ne nous paraissaient pas du tout essentielles au sujet ? Ou le dossier qui doit être complet pour passer à l’étape d’instruction avec des informations finalement pas si importantes et qui peuvent être demandées plus tard ? Il faut, en fait, trouver le juste milieu entre les contraintes qui assurent la « solidité » de la base et l’intérêt pour l’utilisateur.

 

Grand merci à Tétranos pour ses apports et à Elise pour sa relecture et ses questionnements


Laisser un commentaire

Population totale ou population municipale ?

L’INSEE vient de publier les populations légales 2020, authentifiées par décret au journal officiel. Les chiffres fournis à la commune sont accompagnés d’une série d’analyse à l’échelle nationale ou régionale.

 

Taux de variation annuel de la population par département entre 2014 et 2020

Ces populations légales comprennent la population municipale et la population comptée à part.

Leur somme correspond à la population totale et c’est cette dernière qui est  la plus souvent utilisée pour l’application des dispositions législatives ou réglementaires : calcul des dotations, calcul du nombre des conseillers municipaux, … La Commune d’Argonay communique d’ailleurs en ce début d’année sur les incidences du passage au dessus du seuil des 3 500 habitants.

La population municipale, qui évite les doubles comptes en n’intégrant pas les  populations comptées à part, est quant à elle préférentiellement utilisée pour réaliser des statistiques

Depuis 2008, avec la mise en place du nouveau recensement, cette population légale évolue chaque année.  La France compte officiellement au 1er janvier 2020 67 millions 162 000 habitants (67 162 000). Ce chiffre représente la population légale applicable en 2023 pour les lois et règlements, sauf disposition contraire.

L’analyse détaillée fait ressortir une croissance démographique qui s’atténue dans une grande majorité des régions. L’INSEE, dans sa publication du mois de novembre, annonçait d’ailleurs une augmentation jusqu’en 2044 pour ensuite décroitre.

Les données sont téléchargeables et d’ores et déjà visualisables sous forme de carte. Voici un exemple superposant la population et le taux de croissance 2014-2020 (attention la population affichée est la population municipale, à visée statistiques, pas la population totale).

Pour aller + loin :

https://www.insee.fr/fr/information/6679541

https://www.vie-publique.fr/en-bref/287668-populations-legales-les-chiffres-pour-2023


Laisser un commentaire

Carto à gogo

La crise sanitaire que nous traversons nous donne l’occasion de lire, de découvrir, de s’enrichir. Et il faut dire que côté data et carto ça ne chôme pas !

Depuis le début on assiste à une multiplication de tableaux de bords statistiques et cartographiques.

  • Tous les éditeurs s’y essayent, ESRI en tête avec un tableau de bord français et un espace ressource.
  • Santé public France intègre quant à elle de nombreuses données sur sa plateforme statistique  Géodes, appuyée sur Geoclip, éditeur récemment rentré dans le giron de Cyril group où l’on trouve aussi business geographic.
  • On trouve des représentations particulièrement jolies comme celle de Nicolas Lambert dont toute la démarche est décrite sur le blog neocarto.
  • Et dans ce panorama il ne faut pas oublier toutes les infographies réalisées par les journaux. J’aime particulièrement celles du Monde dans la rubrique « Les décodeurs« .

 

La clé, les données

Ces représentations s’appuient sur un socle de plus en plus large de données, accessibles, et majoritairement ouvertes.

Mondialement, ce sont les données mises en place par l’université Johns-Hopkins qui sont le plus utilisées. Le tableau de bord de l’université Johns-Hopkins utilise le dashboard d’ESRI, comme l’OMS et de nombreux organismes et collectivités.

Derrière ces données, il y a beaucoup de travail comme le relate l’article de sciences et avenir ou du Parisien. En effet, les sources de données se multiplient, mais pour établir un tableau de bord il faut les mettre dans l’ordre, on pointe ici du doigt toute la complexité de la big et de l’open data.

Côté français aussi les données sont disponibles. On les retrouve consolidées par OpenCOVID19-fr, une organisation informelle qui publie ses données sur data.gouv.fr ou à travers le tableau de bord édité par Etalab sur a base des données consolidées de Santé Publique France.

 

Des cartes pour respecter la règle

Des cartes viennent également en aide aux citoyens. Notamment celles qui permettent de visualiser le périmètre de 1 km autour de son domicile. Le géoportail explique comment calculer ce buffer en version grand public. Et les différentes versions permettent de rentrer dans le débat entre le calcul à vol d’oiseau ou en fonction des distances liées à la voirie environnante. La carte d’isigeo combine les 2 représentations mais aussi un tableau de bord. Ce débat est évoqué sur le site « Arrêt sur image« , un journal indépendant de critique des médias que je viens de découvrir grâce à Bruno : le texte de loi évoque clairement un rayon d’1 km.

Cette profusion est parfaitement décrite par Françoise sur Decryptageo avec un titre tout à fait à propos : Un kilomètre à pied… ça use les applis.

 

Des sites pour consommer local

La dernière vague concerne les cartes permettant de localiser les magasins ouverts et les lieux de vente de produits locaux.

On a là plutôt des sites de communication, mis en place pour soutenir l’économie locale, comme la plateforme qui relie producteurs et consommateurs en Bretagne ou le site mis en place par la Ville d’Avignon. Les collectivités se mobilisent. Le Grand Poitiers présente carte et jeu de données sur les commerces ouverts, une bonne occasion de vulgariser l’ouverture des données et le rôle des collectivités dans ce grand mouvement.

On trouve aussi « proxisur« , un projet né en italie au début du confinement à Reggio Emilia. La carte s’appuie sur Woosmap, un partenaire google.La gazette des communes a zoomé sur ce phénomène avec le titre « L’open-data au service des citoyens confinés« .

Le maître-mot, dans ce contexte, est « citoyen » et « participatif ». Pour moi, c’est la carte construite par la communauté française openstreetmap qui respecte le mieux ces deux mots. Le nom du site correspond parfaitement à la cible : « ça reste ouvert » et il est très facile de contribuer tout autant sur un ordinateur que sur un mobile. Un blog a même été ouvert en accompagnement qui permet de découvrir l’avancée internationale de ce beau projet !

 

Mais en tout cas #on reste encore un moment à la maison !

Toute cette diversité est extrêmement intéressante.
Dommage qu’elle participe à cette overdose d’info autour du corona virus.

 

Article rédigé par AlineC avec les idées de Jean-Michel, Bénedicte, Bruno et plusieurs liens relayés sur le GeoRezo


Laisser un commentaire

35 000 communes

36 600 communes : c’était la référence que j’avais depuis le tout début de mes études, il y a quelques années déjà …

Voilà donc une référence à revoir : au 1er janvier 2019 nous en serions à 34 980 communes, disons 35 000 pour faire simple. En janvier 2016 je titrais sur 36 000. Le mouvement s’est depuis lors poursuivi.

Les comptes paraissent simples : déduire les communes fusionnées, 2 communes très souvent mais jusqu’à 22 pour le maximum, et rajouter le nombre de communes nouvelles. Mais les comptes ne sont pas si simples car :

  • il y a eu des doubles fusions, c’est à dire des fusions de fusions. On parle aussi d’extensions de communes nouvelles.
  • Et la procédure devient réellement officielle avec la parution d’un arrêté au journal officiel, ce qui parfois prend un certain temps.

Malgré les éléments de méthode qui avaient été publiés, il s’avère qu’un certain nombre de fusions ne respectent pas les règles de nommage que nous avions évoquées en novembre 2017. Ce sujet a été évoqué à la commission nationale de toponymie de juin 2018, le compte-rendu est disponible sur le site du CNIG.

Les ressources sur le sujet sont très nombreuses :

  • L’AMF, association des maires de France, est très active sur le sujet et propose toute une série de documents au services des collectivités qui entreprennent une telle démarche : communes nouvelles : une dynamique confortée et d’avenir.
  • Un article de Maire info de janvier 2017 décrypte le processus en cours et présente une carte sur laquelle il serait intéressant de rajouter les fusions 2018.
  • Wikipédia récapitule la liste des communes concernées par année : Liste de communes nouvelles.
  • Les acteurs du SIG suivent également ça de prés. En témoigne le dernier fil de discussion sur le millésime 2019. Vous y trouverez également plein de liens vers des ressources à jour.

J’en profite pour dire merci à ceux qui se mettent au service de tous pour tenir à jour ces bases. Car les contours communaux sont un référentiel essentiel en matière de cartographie mais également de statistiques.


Laisser un commentaire

36 000 communes ?

 
En ces périodes de disette, un fort mouvement de regroupement des communes vient de s’opérer.
Pas de hasard cependant : une loi de mars 2015 relative à « l’amélioration du régime de la commune nouvelle pour des communes fortes et vivantes », loi fortement appuyée par l’AMF, association des maires de France.

Avec en prime une carotte financière pour les communes nouvelles créées au plus tard le 1er Janvier 2016 à travers une garantie de non baisse de la DGF (Dotation Globale de Fonctionnement). La mesure a rencontré un réel succés et déjà la date butoir est repoussée au 30 juin 2016.
D’après les chiffres évoqués par l’AMF ce sont plus de 300 communes nouvelles qui se sont ainsi créées dont 19 résultant de fusion intercommunales, à l’image de la nouvelle commune Cherbourg-en-Cotentin qui correspond à l’ancienne communauté urbaine de Cherbourg. Wikipédia en recense 309 au 14 janvier et de nouveaux arrêtés de fin d’année devraient encore être publiés au journal officiel. Plus


2 commentaires

Info’s carto statistique

Cet article ne sera surement pas exhaustif mais je voulais lister un certain nombre de données carto et statistiques qui sont désormais facilement accessibles.

Plus


1 commentaire

Redessiner les contours de la Politique de la Ville

Les données carroyées de l'INSEE sont sorties des domaines réservés et somme toute restreints de la statistique et de la géomatique au travers de la rédéfinition des zonages de la politique de la Ville. En effet, l'Etat a décidé de s'appuyer sur ces données pour redessiner ces contours.
Les données carroyées de l’INSEE sont sorties des domaines réservés et somme toute restreints de la statistique et de la géomatique au travers de la rédéfinition des zonages de la politique de la Ville. En effet, l’Etat a décidé de s’appuyer sur ces données pour redessiner ces contours.

  Plus


7 commentaires

La stat en carrés

Nous entamons ici une série d’articles sur les nouvelles données carroyées de l’INSEE. Dans ce premier article, et sans répéter l’importante documentation disponible, nous allons essayer de décrire simplement en quoi consistent ces données. Nous aborderons ensuite l’application de ces données aux réflexions en matière de zonage Politique de la Ville.

  Plus


3 commentaires

Un guide pour les observatoires de l’habitat

Le réseau Habitat-Logement d’IDEAL Connaissance publie en ce début d’année le guide « retours d’expérience sur les observatoires de l’habitat et premiers outils méthodologiques ».
Ce document vient conclure une série de quatre rencontres tenues entre mars et octobre 2012, qui ont rassemblé entre 30 et 40 participants autour des sujets suivants :

  • L’observatoire de l’habitat, définition, objectifs, données à utiliser
  • Les données et indicateurs
  • Communiquer et partager ses résultats

Ce groupe de travail observatoires s’est attaché à répondre aux nombreuses questions postées à ce sujet sur le forum du réseau Habitat-Logement.
Il était composé de nombreux chargés d’étude PLH mais également de personnes de l’Etat : DREAL, CETE, Ministère. Les échelons communaux et départementaux étaient représentés mais la majorité était intercommunale. Plus


1 commentaire

Stat’s en carte

Observatoire des territoiresIl y a quelques semaines était mis en ligne le nouvel espace cartographique de l’observatoire des territoires. Il s’agit là d’une refonte de l’ « observatoire des territoires » proposé par la  DATAR.

Ce site présente un exemple particulièrement abouti des possibilités de combinaison des représentations cartographiques et statistiques.

Il s’appuie sur une série d’indicateurs clé des territoires. Indicateurs accessibles, pour une partie, jusqu’à l’échelle communale. Ce portail permet de superposer plusieurs analyses et de mettre côte à côte plusieurs cartes.

Il permet également de générer des portraits de territoire ou  de faire ses propres analyses avec des données importées. Plus


Laisser un commentaire

- Faire un don - Contact - Mentions légales -