Une méthode pour affecter une série au « bon » thème
Une série de billets tentent d’expliquer à quel thème (dominant) affecter telle ou telle série de données.
Suite à des échanges avec un honorable correspondant, par exemple sur l’affectation de séries de données relatives aux mines et carrières, j’ai pensé utile de vous découvrir la méthode infaillible pour trouver à quel thème affecter une série de données lorsqu’on en saisi les métadonnées.
En fait, il y en a deux, mais la première consiste à connaître par cœur les 600 pages. Normalement, ce n’est pas votre cas, on va donc faire autrement.
La méthode demande un clavier, un écran et une connexion internet (au moins au départ).
1/ Récupérer le texte en français du (projet de) règlement sur les spécifications des annexes II et III. C’est ici (. doc, 2,8 Mo).
2/ Rechercher le mot clé lié à votre série de données.
3/ Rechercher encore pour être sûr d’avoir bien balayé tout le texte.
4/ Voir dans quelle partie c’est. Vous avez le thème.
Application sur « mines » :
Les deux premières occurrences sont trouvées dans la définition d’un « talus de déblais » et de « feux de mines ». Passons.
Les mines et carrières (description des objets physiques et juridiques) sont dans le thème « ressources minérales ». Voilà.
Il y a bien la notion d’ « Industries extractives » dans le thème III-4 « Usage des sols ». Comme vous êtes habiles, vous voyez vite que ce ne sont que des attributs de zones dans les documents d’urbanisme.
Facile, non?
Il est possible que vous ne trouviez pas quelques séries dans ce règlement alors qu’elles sont bien dans INSPIRE (les photos obliques de crue…). Cela s’explique par le fait qu’elles sont trop rares pour valoir la peine de normaliser leur structure.
Toutefois, la plupart du temps absence vaudra exclusion du champ. Exemple : les terrains de camping.
Tags: affectation, données, INSPIRE, règlement, spécifications, thèmes
9 octobre 2013 à 12:07
Est-ce que la commission « Données » du CNIG n’est pas une troisième voie?
9 octobre 2013 à 12:19
Et dans le cas exemplaire des mines, ne sont-elle pas considérées aussi comme des complexes d’activités (classe générique notamment utilisées dans le thème « Lieux de production et sites industriels », qui évoque dans la directive l’extraction minière)?
Plus largement, est-ce qu’une série de données peut « alimenter » plusieurs thèmes dominants? Comment faire alors pour diffuser l’info sans provoquer une multiplication des efforts?
21 octobre 2013 à 14:37
C’est en effet dans son mandat, mais pourquoi une troisième voie? Il y en a une deuxième?
21 octobre 2013 à 14:43
Le guide de saisie du CNIG recommande de ne noter que le thème « dominant ». La raison en est qu’on ne pourra pas être conforme à deux modèles de données en même temps.
Retenir le thème « ressource minérales » par la méthode proposée évite que chacun ne se creuse la tête pour aboutir à des conclusions divergentes, le contraire de l’interopérabilité et de la préservation des ressources rares (par exemple : mes neurones). Les spécifications fournissent une et une seule réponse : pourquoi se compliquer la vie?
24 octobre 2013 à 16:27
Marc Leobet dit:
21 octobre 2013 à 14:37
C’est en effet dans son mandat, mais pourquoi une troisième voie? Il y en a une deuxième?
Ben oui, la première est celle présentée dans le billet (utilisation des mots-clés), la seconde (citée au début) est de connaître « par cœur » les 600 pages (ou au moins les avoir balayé en profondeur et en garder une idée claire : pas facile pour tous les thèmes, j’avoue).
D’où la troisième voie : la commission « Données » du CNIG…
24 octobre 2013 à 17:03
Effectivement, la solution de facilité est de se limiter au thème « dominant ».
Néanmoins, si l’utilisateur (car à terme il faudra se placer du point de vue de l’utilisateur, et pas seulement du producteur/détenteur de données) recherche une caractéristique particulière d’une série de donnée (par exemple l’autorité responsable de la mine), il a plus de chance de la trouver dans certains attributs d’un thème secondaire spécifiquement prévus à cet effet (dans le même exemple, l’attribut « permission » du complexe d’activité utilisé par le thème « Lieux de production et sites industriels ») que dans le thème dominant où cette approche peut être omise…
Il conviendrait donc de traiter pour chaque information disponible l’enrichissement de jeux de données dans toutes leurs dimensions, et pas uniquement au niveau du thème dominant (mais si déjà on commence par là, ça sera bien).
J’arrête de polémiquer. Le mieux est l’ennemi du bien.
27 octobre 2013 à 19:45
Non, ce n’est pas de la polémique, c’est juste l’avenir. Simplement, ce n’est pas et cela ne sera jamais dans les métadonnées. En revanche, c’est déjà dans les flux WFS.
A mon avis, l’avenir de la recherche dans les données géographiques passe par le WFS. Les métadonnées apportent autre chose, qui ne sont nulle part : la généalogie, la résolution, les droits divers…
Ce n’est que faute de mieux, dans l’état de l’art actuel, qu’on s’en sert pour la recherche.