jeudi, 24 juin 2021

Un service de GéoRezo

Tag » Cadastre

Les 3 accès à DVF

 
En mai 2019, je saluais sur ce blog l’ouverture en opendata et donc en accès libre des données « DVF » c’est à dire les données sur les transactions immobilières et foncières.
Entretemps j’ai pu découvrir dans ma propre pratique professionnelle que ces données en opendata n’étaient pas complètes par rapport aux données d’origine. En particulier, elles ne fournissent pas ce que j’appellerais ici la clé foncière, par analogie avec la clé parcellaire, qui permet de structurer ces données. C’est toute la difficulté de l’opendata entre volonté d’ouverture et protection des données personnelles !

En effet, les données de valeurs foncières « DVF » ne peuvent être utilisées « telles quelles » ou « à plat », sinon les traitements font ressortir des données fausses et des répétitions. En faisant simple : comme les données cadastrales, les données foncières en brut présentent autant de lignes répétées que de locaux principaux et secondaires et de parcelles faisant l’objet d’une même disposition.

Grace au Groupe National DVF, constitué depuis 2012 dans la lignée des travaux précédemment engagés dans le cadre de l’ADEF, cette difficulté peut être oubliée. Ces travaux ont permis d’organiser le traitement des données au travers d’une version améliorée de DVF appelée DVF+ portée par le CEREMA.

 

DVF+

La version opendata de DVF+ reprend l’ensemble des champs présents dans la donnée source « DVF version opendata « et permet :

  • de géolocaliser les transactions à la parcelle
  • de structurer DVF selon un modèle de données partagé en 12 tables principales et de caractériser les biens, ce qui est indispensable pour procéder à des analyses foncières et immobilières pertinentes : il s’agit de ne pas mélanger indistinctement des choux et des carottes, et plus globalement le neuf et l’ancien car les volumes et les prix ne sont pas comparables, …

Du fait de la disparition des champs d’identification de la mutation et du local dans la donnée open-data, des identifiants fictifs ont été reconstitués à la place des identifiants réels. DVF+ open-data est téléchargeable gratuitement sous différents formats :

  • Fichiers SQL pour intégration de l’ensemble des données DVF dans une base de données PostgreSQL/Postgis structurée dans le modèle DVF+ (17 tables + données brutes DVF). L’intégration dans la base postgres se fait à l’aide de l’application AppDVF, mise à disposition elle aussi gratuitement
  • Fichiers simples 1 ligne – 1 mutation, directement utilisables en format SIG Geopackage (.gpkg), ou en format tableur (.csv). Dans ces 2 formats, chaque ligne correspond aux informations d’une vente, avec une géométrie associée dans la version SIG.

 

Le modèle DVF+ est donc constitué de 12 tables et de 5 tables annexes :

  • Parmi elles, la table « mutation » est centrale car elle contient les éléments de prix (la fameuse « valeur foncière ») et synthétise en une ligne les éléments caractéristiques de la vente (champs calculés par le Cerema).
  • Pour une analyse plus fine, il conviendra de requêter sur les autres tables du modèle renseignant sur le détail des dispositions. Deux tables détaillent notamment le ou les locaux au sens fiscal du terme, et la ou les parcelles concernées par la transaction.

 

DV3F

La donnée DVF ou DVF+ reste cependant insuffisante pour analyser la complexité du marché foncier et immobilier. La valeur d’un bien se construit en effet en grande partie sur ses caractéristiques propres (nombre de pièces, année de construction, nature détaillée des locaux…) et sur le contexte de la vente (informations sur l’acquéreur et le vendeur, informations sur la destination du bien après la vente…).

Pour pallier à ce constat, le Cerema expérimente depuis 2015 un nouveau modèle de données : DV3F, qui croise la donnée DVF et les Fichiers Fonciers (retraitement des données MAJIC qu’il produit annuellement). Reprenant la même structure que DVF+, le modèle DV3F est plus riche (13 tables principales et 7 tables annexes dans le format v4 actuel) et concentre lui aussi sur les informations essentielles d’une vente sur la table mutation (130 variables + géolocalisation à la parcelle).

Par ses nombreuses variables, il permet d’affiner la description physique des biens objets de la vente (année de construction notamment), propose une typologie de ces biens (celle du GnDVF) et apporte des informations sur le type de propriétaire avant/après (typologie, raison sociale des personnes morales…).

Pour cette base enrichie la donnée n’est pas ouverte à tous. Ce format est disponible depuis 2020 à l’ensemble des ayants-droits des Fichiers Fonciers (essentiellement les collectivités publiques).

 

En résumé :

[DGFiP] DVF opendata, 07/2015 à 06/2020, 1 fichier texte France entière par année, mise à jour semestrielle (avril/octobre) : une version « brute » et volumineuse difficile à utiliser ; https://www.data.gouv.fr/fr/datasets/demandes-de-valeurs-foncieres/

[Etalab] DVF géolocalisé et normalisé, 01/2014 à 06/2020, 1 fichier csv par année et par commune, mise à jour semestrielle : géolocalisation (lat/lon) des parcelles mais toujours présence de doublons : https://www.data.gouv.fr/fr/datasets/demandes-de-valeurs-foncieres-geolocalisees/

[Cerema] DVF+ opendata, 01/2014 à 06/2020, 1 fichier par département, mise à jour semestrielle : une version structurée en format SQL ou « à plat » aux formats csv et shp : https://www.data.gouv.fr/fr/datasets/dvf-open-data/

[Cerema] DV3F format v4, janvier 2010 à décembre 2019 : une donnée structurée et enrichie à intégrer dans une base postgres/postgis, accessible aux ayants-droits : https://datafoncier.cerema.fr/donnees/donnee-dv3f

Et, en bonus, clé en main pour des recherches ponctuelles, la carte proposée par Etalab, s’appuyant sur la version DVF géolocalisée : https://app.dvf.etalab.gouv.fr/

 

Ces apports en données et en méthode sont complétés par toute une série de guides et tuto. En effet, l’accès apparemment facile à ces données ne doit pas faire oublier un certain nombre de principes à respecter :

  • Celui du secret statistique avec des analyses à baser en toute logique sur au moins 11 valeurs.
  • Extraire les ventes particulières. En l’occurrence un filtre a été créé pour repérer et exclure les biens rares ou des conditions de vente spécifique.
  • Baser ses analyses sur des biens simples plutôt que sur des mutations complexes, mélangeant plusieurs logements ou plusieurs types de locaux.
  • Et tenir compte des indications données dans la mutation sur la qualité de l’information : les terrains à bâtir sont potentiellement sous estimés et la construction neuve est également difficile à caractériser, en particulier les VEFA.

 

Pour aller + loin :

Le site du Groupe national DVF, présentant la donnée DVF et ses usages : https://www.groupe-dvf.fr/

Le tuto complet en version web : http://doc-datafoncier.cerema.fr/dv3f/tuto/

Toutes les ressources Dv3F : https://datafoncier.cerema.fr/ressources/donnee-dv3f

 

Et encore :

https://datafoncier.cerema.fr/donnees/autres-donnees-foncieres/dvfplus-open-data
https://georezo.net/forum/viewtopic.php?id=98688&p=2
https://www.oramaritima.fr/wp-content/uploads/2019/11/3-DV3F_Cerema_27sept2019.pdf
Débat sur le modèle : Forum GeoRezo / DVF : l’intégration facile proposée par le Cerema
Discussion sur l’accès aux données et la version opendata : Forum GeoRezo / DVF (Données de Valeurs Foncières) publiées en Opendata

 

Article rédigé avec les enrichissements de Julien Place et la lecture attentive d’Antoine et Bruno, merci à eux.


1 commentaire

Stage interconnecté

Le SIG, je l’explique souvent comme une carte avec des informations associées. Des fois, c’est aussi l’inverse : ce sont plutôt des informations que l’on peut « géolocaliser » ou rattacher par exemple à la commune. Mais le couplage des deux dimensions dans une même interface accessible n’est pas toujours simple.

Le stage conduit de mars à octobre 2020 au Grand Avignon a réellement permis de valoriser les données et « l’Atlas Immo » existant, en y couplant une troisième dimension c’est à dire l’interconnexion avec d’autres bases de données.

C’est un stagiaire de mastère SILAT de Montpellier qui est venu renforcer le service Habitat-PLH en lien avec le service SIG. Tancredi s’est très vite intégré, a parfaitement cerné les enjeux de la démarche, découvert les outils utilisés, et exploité ceux-ci au mieux, principalement postgre et géo.

Au départ il y avait une « couche » SIG dénommée « Atlas Immo » et ayant l’ambition de suivre les projets et la promotion immobilière dans un contexte de marché de l’habitat peu actif. Construite depuis 2008, passée d’un outil à l’autre, d’un format à l’autre, mise à jour avec peu de temps alloué.

L’objet du stage était donc de « nettoyer » cette couche, d’en améliorer la structure et l’ergonomie, en s’inspirant d’autres exemples. De ce côté là, il a été difficile de trouver des initiatives équivalentes à la fois dans le contenu et les moyens disponibles.

Au final, ce qui est véritablement le résultat le plus intéressant de ce travail a été l’interconnectivité mise en place avec d’autres sources d’informations :

  • l’instruction des permis, application du droit des sols ou ADS dans notre jargon,
  • le suivi des raccordements à l’assainissement collectif, Participation pour le Financement de l’Assainissement Collectif ou PFAC,
  • l’exploitation des données majic du cadastre pour préciser l’occupation des logements,
  • et, enfin, les données sur les ventes immobilières au travers des données PERVAL.

 

schéma données

Extrait du schéma des données

Cette mise en relation des informations permet à la fois d’améliorer la qualité de la saisie en vérifiant les informations contenues dans les autres bases mais également de valoriser les données collectées depuis de nombreuses années, telles que les données sur les ventes, sous la forme de statistiques.

Dans la même carte, les informations sont à la fois accessibles à l’opération mais également sous forme de fiches récapitulatives et statistiques à la commune. On a donc :

  • une représentation cartographique et des analyses associées comme par exemple les opérations abouties ou pas,
  • des informations qui permettent de suivre l’évolution des projets tels que les permis successifs et le nombre de logements prévus ou bien la part du logement social ainsi que des commentaires qui permettent de suivre les contacts pris avec les porteurs de projet ou l’avancement des travaux,
  • et des informations et statistiques associées associées à la parcelle.

Sur le même modèle, un travail est en cours pour les autres thèmes de l’observatoire de l’habitat intégrés dans la « carte Habitat » :

  • L’Atlas LLS; c’est à dire Logement Locatif Social, avec des liens avec les informations contenues dans le fichier RPLS, Répertoire des logements locatifs des bailleurs sociaux, à la fois sous forme d’informations détaillées et sous forme de statistiques attachées à chaque programme.
  • L’Atlas Copro avec l’intégration des statistiques d’occupation construite depuis 2009 et de données dynamiques là encore à partir des données cadastrales en cours.

Finalement, ces 6 mois n’ont vraiment pas souffert du contexte confiné et très largement télétravaillé : connexion à distance et interconnexion étaient les maître-mots de la période ! Merci Tancredi et Jérome !

 


Laisser un commentaire

Un plus pour les études d’urbanisme

Difficile pour moi de ne pas revenir sur la mise à disposition du cadastre en opendata, annoncée très largement et rappelée par le blog parcell’air il y a peu (https://georezo.net/blog/parcellair/2017/10/02/cest-open-data-pour-le-cadastre/).

Même si la démarche parait aujourd’hui évidente, que de chemins et galères parcourus avant d’en arriver là !

Les discussions sur le GeoRezo relatent bien cette évolution :

Merci à qui ?

Avant même la tempête opendata, INSPIRE avait enclenché la démarche d’ouverture en considérant que le fond cadastral était une donnée de référence (annexe I).

Mais rappelons nous, aussi, que ce fond en majorité vectoriel a été construit par les services du cadastre avec, fréquemment, le soutien financier des collectivités locales et des subventions des plateformes régionales d’information géographiques, comme celles mobilisées par le CRIGE PACA auprès de la Région. Ces plateformes s’étant également engagées dans la diffusion de ces données à l’image de GéoBretagne (https://cms.geobretagne.fr/content/telechargement-du-cadastre-2017).

Chemins et galéres

Avant le site du cadastre ou le géoportail, on a traversé une longue période d’interrogation quant à la mise en ligne des données cadastrales. Le blog Inspire by Clouds, hébergé sur le GeoRezo, évoquait cet aspect en 2009 : https://georezo.net/blog/inspire/2009/01/07/va-t-on-modifier-la-loi-%C2%AB-informatique-et-liberte-%C2%BB/. Les questions que l’on se posait alors sur l’affichage des numéros de parcelle vis à vis des réglementations de la CNIL peuvent paraître aujourd’hui complétement surréallistes !

Attention

Par contre, rappelons que cette ouverture ne concerne que les données graphiques. Les données « alphanumériques » de la « matrice cadastrale », communément appelée Majic, ne sont pas accessibles par « tout un chacun ». Elles nécessitent une déclaration CNIL car elles contiennent des informations à caractère personnel sur les propriétaires notamment.

Et si le cadastre est repéré comme donnée de référence dans le cadre d’INSPIRE, pour beaucoup de géomaticiens il ne constitue pas à proprement parler un référentiel géographique comme le rappelle Maël sur twitter.

 

Espérons que cette initiative va perdurer. Il me semble que le « modéle économique » est ici évident tant cette mise à disposition va simplifier les échanges et éviter la maintenance de services de diffusion multiples.

Faisons confiance en la communauté géomatique pour se tenir au courant, elle veille au grain sur ce fil de discussion : https://georezo.net/forum/viewtopic.php?pid=301336#p301336

 

Merci pour l’aide de Stéphane, Franck, et de mon compère de Parcell’air Jean-Michel.


1 commentaire

Groupe de travail sur DVF

Dans le cadre du réseau habitat logement d’IDEAL connaissances, était organisé début décembre un groupe de travail sur les données DVF, données que nous avions déjà présentées début 2013 sur ce blog.
Il s’agissait là de prolonger l’esprit des groupes de travail Observatoires de l’habitat qui se sont déroulés en 2012, autour de présentations et d’exemples qui soient sources de questions et débats.
Le public réuni était un public averti en matière d’observation mais diversifié du point de vue des organismes et collectivités d’origine : collectivités locales, CG, ADIL et ANAH et un bureau d’étude.
 

Plus


1 commentaire

Des limites communales à grande échelle

La communauté OSM vient d’achever la constitution d’un référentiel d’importance, celui des limites communales.  Il n’existe pas de support officiel me direz vous ? Eh bien non !

On avait pris l’habitude de s’appuyer sur les fichiers GeoFLA de l’IGN, mais ceux-ci convenaient pour des représentations et analyses statistiques à une échelle régionale, mais pas dès que l’on travaillait à l’échelle communale ou intercommunale. Plus


1 commentaire

Le cadastre, un référentiel central de l’urbanisme

Le cadastre, qu’est ce que c’est ? Plus


2 commentaires

- Faire un don - Contact - Mentions légales -