TJS : le nouveau standard de partage de données géo-statistiques

On Tuesday 04 October 2011 à 08:59, in BIG Articles, by mauviere

Table Joining Service est un des tout derniers standards mis au point par l’Open Geospatial Consortium. Si cette norme a rapidement suscité un intérêt en France, on le constate dans les cahiers des charges qui sortent, c’est parce que :

  • elle soulage les gestionnaires d’applications statistiques, qui peuvent intégrer sans effort dans leurs bases des données prêtes à l’emploi ;
  • elle ouvre aux utilisateurs d’observatoires un large éventail d’indicateurs utilisables : avec TJS, ils se connectent de façon transparente à de nombreux serveurs de données ;
  • elle offre un format de sauvegarde intelligent de jeux de données documentées : les méta-données permettent de définir automatiquement les bons retraitements et les bonnes représentations cartographiques en fonction des caractéristiques propres des indicateurs ;
  • elle est facile à implémenter, en tout cas beaucoup plus facile que GML.

TJS est le chaînon manquant entre WMS et GML. WMS distribue des images, qui sont certes d’emploi immédiat, mais offrent peu de possibilités de retraitements, d’extractions ou de valeur ajoutée. GML est un format verbeux et complexe. Son polymorphisme rend l’écriture de modules de décodage génériques rebutante. A contrario, TJS délivre des fichiers compacts, simples à lire et à générer. Ils peuvent s’intégrer dans toute sorte de retraitements, dans l’esprit des Web Processing Services. Ce n’est d’ailleurs pas un hasard si les standards WPS et TJS ont le même « Papa », à savoir le Canadien Peter Schüt.

Certains lecteurs se disent sans doute : « TJS, c’est peut-être utile pour les statisticiens, mais quel rapport avec la géomatique ? » TJS part du constat que toute information statistique peut être géo-référencée. Par exemple une donnée de PIB concerne une région particulière, identifiable en France par un code à 2 caractères. Le nombre d’habitants d’un Iris est cataloguable car cet Iris a lui aussi un identifiant alphanumérique officiel. Les listes des régions, des communes, des Iris relèvent de référentiels normalisés. Si les premiers exemples qui viennent à l’esprit concernent des territoires (représentées par des polygones sur une carte), un référentiel géographique peut également se rapporter à des points (le répertoire Sirene associe un code unique à chaque établissement de France), ou à des lignes (ex : des tronçons routiers).

On ne tranchera pas ici le fait de savoir si la donnée statistique est un attribut de la donnée géographique (vision du géomaticien), ou si l’inverse est plus pertinent (vision du statisticien). TJS organise un découplage clair entre les référentiels géographiques, en nombre limité, et les données qui peuvent s’y rattacher, bien plus foisonnantes.

Ses concepteurs considèrent qu’il est absurde d’encoder ensemble, systématiquement, des données statistiques et des données géométriques, si cette géométrie relève de référentiels normalisés. Pour visualiser une série de cartes statistiques communales, on gagne à charger le fond de carte vectoriel d’abord, une fois pour toute, et à récupérer ensuite des jeux de données. La présence des mêmes codes géographiques dans le fond de carte et dans le jeu de données permet d’apparier les deux automatiquement et de produire des analyses thématiques.

TJS encode donc des données statistiques géo-référencées, relatives à un référentiel géographique clairement identifié. Un paquet TJS annonce par exemple : « les données qui suivent s’inscrivent dans le référentiel « communes de France », millésime 2010, identifié par telle URI, géré par tel organisme ». Mais le transfert de la géométrie n’est pas son propos.

Il présente ensuite les données. Un paquet TJS peut contenir un ou plusieurs jeux de données ou « datasets ». Par exemple un dataset « état civil » : naissances, décès et mariages par commune et par année depuis 10 ans, et un dataset « risques naturels » par commune (séisme, inondations, feux de forêt). Un dataset est documenté (libellé, producteur, date de publication, documentation, URL…).

Chaque dataset expose ses clés primaires (code géographique, année…) et ses variables statistiques. Une variable, documentée de façon littérale comme le dataset, peut être d’au moins 4 types différents : caractère, rang, numérique additif, numérique non additif. D’autres informations facilitent la cartographie automatique de ces variables : palette de couleur recommandée pour les typologies, caractéristique gaussienne ou pas de la distribution… La distinction additif / non additif est utile en cartographie thématique, elle permet de décider de la représentation (symboles proportionnels ou dégradé choroplèthe). Mais elle l’est aussi dans l’optique de traitements non cartographiques, comme l’agrégation des données à un niveau géographique plus large.

Les données enfin sont listées dans le paquet TJS ligne par ligne, dans des nœuds XML simplifiés.

Le format TJS est un format XML léger, à la fois précisément documenté et optimisé pour une lecture rapide des informations qu’il contient. Mais TJS est aussi un protocole de service web, répondant à différentes requêtes :

  • getCapabilities : donne les caractéristiques générales du service, langages supportés, nombre maximal d’entités renseignées dans les paquets délivrés ;
  • describeFrameworks : liste les référentiels géographiques mobilisés par le serveur TJS
  • describeDatasets : liste les thèmes (ou jeux de données) proposés pour un framework donné ;
  • describeData : décrit les variables de chaque dataset ;
  • getData : renvoie les données d’un dataset pour un jeu de variables et des entités géographiques spécifiés.

TJS sépare la gestion des fonds de carte de celles des données statistiques. Il simplifie à ce titre la vie des géomaticiens et des statisticiens. Il fonctionne aussi comme intégrateur de différents services web. Le fond de carte peut être délivré par un service WFS, les données par un serveur TJS t1, l’appariement réalisé par un serveur TJS t2, le rendu final par un serveur WMS. Différents Web Processing Services peuvent s’enchaîner après extraction d’un flux TJS : agrégations, appariement entre différents datasets, mise à jour automatisée d’un autre entrepôt de données.

En France, nombre de collectivités territoriales et d’acteurs statistiques centraux ont perçu l’intérêt de TJS. Pourquoi gérer soi-même des données de cadrage de plus en plus nombreuses alors qu’on peut les obtenir dynamiquement via TJS, toujours à jour, auprès de l’Insee ou d’autres producteurs spécialisés ?

Rédacteur : Eric Mauvière

Pour en savoir plus :
www.opengeospatial.org/standards/tjs
geoprocessing.info/tjsdoc/
www.geoclip.fr/fr/p43_tjs.php

Tagged with:
 

7 Responses to “TJS : le nouveau standard de partage de données géo-statistiques”

  1. Benoit DAVID dit :

    Bonjour,
    Savez-vous si TJS est un service de téléchargement au sens d’Inspire, c’est à dire est-il conforme au règlement Inspire définissant les services de téléchargement ?
    Merci d’avance
    Benoit DAVID

  2. Eric Mauvière dit :

    Bonjour,
    et merci pour votre question.

    Je dois reconnaître qu’Inspire, jusqu’à présent, m’inspire assez peu. Je fais toutefois l’hypothèse que les membres de l’OGC et les concepteurs d’Inspire partagent le même objectif : faciliter l’accès à l’information géolocalisée.TJS définit un format de stockage, documenté et interrogeable, dans l’esprit de la plupart des protocoles mis au point par l’OGC. Mais TJS n’est pas qu’un format d’encodage. Il définit aussi des services à valeur ajoutée, comme le « joining » du sigle l’indique, par exemple d’appariement entre fonds de carte et jeux de données statistiques.

  3. Pierre L dit :

    Merci pour cet article qui résume bien le standard TJS. Petite question, savez-vous s’il existe des services TJS en france déjà opérationnel ou en cours de mise en oeuvre ?

  4. mauviere dit :

    Bonjour,

    voici quelques exemples de serveurs TJS et de requêtes :
    france.geoclip.fr/GC_tjs.php
    https://sister.crbn.fr/GC_tjs.php?SERVICE=TJS&REQUEST=GetCapabilities&AcceptVersions=1.0.0
    http://www.poss-lr.net/geoss/GC_tjs.php?SERVICE=TJS&REQUEST=GetCapabilities&AcceptVersions=1.0.0
    http://www.poss-lr.net/geoss/GC_tjs.php?SERVICE=TJS&REQUEST=DescribeDatasets&VERSION=1.0.0&FrameworkURI=com

    A ma connaissance, les organismes suivants ont commencé la mise en oeuvre à grande échelle, notamment pour transmettre des données entre entrepôts :
    http://www.apem.asso.fr/
    http://www.csipiemonte.it/

    ou projettent d’utiliser ce standard :
    Région Picardie
    Onema

    L’Insee, enfin, a lancé une première étude.

  5. Marc Leobet dit :

    A la lecture des requêtes, et en première approximation, cela pourrait être la solution pour offrir des services de téléchargement (au sens du règlement INSPIRE) adaptés aux données statistiques. Celles-ci sont incorporées dans INSPIRE chaque mois une peu plus et le WFS n’est pas adapté, en effet. Ce billet arrive donc à point!

  6. […] à la structure de leurs informations, qui ne contient souvent pas de géométrie. D’après Eric Mauvière sur le BIG, le standard TJS serait la […]

  7. […] des cours d’eau en ligne, cf. l’expérience ONEMA/BRGM geotraitements.eaufrance.fr) ou TJS fournissent des services web lancés dans l’Internet pour la valorisation de nos informations […]