Quatre retours sur les métadonnées
Toujours suite à la journée de Géobourgogne (sans doute parce que, en ce moment, il neige aussi sur la Défense et que je ne vois même plus la tour d’en face…) :
Si j’ai un jeu de données sans métadonnées, dois-je les saisir? Oui pour mon usage interne, mais sans les diffuser à d’autres car je ne connais pas assez ces données pour être sûr de bien les décrire. Pour les données des tiers, voir le billet « Les données IGN achetées par la collectivité sont-elles concernées?« . Bien entendu, la réponse dépasse le seul cas de l’IGN puisque « nous sommes tous les tiers de quelqu’un ».
Quelle mise à jour des métadonnées de tiers si je complète ses données ? (Je ne prétends pas détenir une réponse infaillible à cette question. Les commentaires sont donc ouverts.)
Nous sommes dans le cas de co-production. Les champs doivent être revus, au moins : résumé, référence temporelle, généalogie, conditions applicables à l’accès et à l’utilisation, responsable.
Quelle gestion temporelle des métadonnées ? Les métadonnées doivent être mises à jour en même temps que les données, ne serait-ce que le champs « référence temporelle » (pratique, ce wiki…).
On parle beaucoup de métadonnées, de modèle conceptuel de données, mais plus de dictionnaire de données, ne faudrait-il pas faire quelque chose ? SI. Le dictionnaire de données va permettre au lecteur de comprendre réellement ce qu’est une route (par exemple) dans la base de données considérée. On est toujours surpris de la variété de réalités que ce simple mot peut recouvrir. Bien sûr, c’est long, mais c’est le seul moyen de savoir réellement de quoi parle les données. L’avantage, c’est que cela se fait sur traitement de texte. Normalement, s’il y a eu production il y a eu consigne de levers ou de saisie, et ce devrait être très facile. Malheureusement, on voit (le plus?) souvent d’abord une production puis… rien. Il est un peu compliqué ensuite de connaître la qualité de ce que l’on diffuse ou reçoit.
Mon petit doigt me dit qu’on va beaucoup parler de qualité dans les mois qui viennent (et pas seulement aux rencontres SIGLL).
NdB : j’ai fini par créer une catégorie « Métadonnées » puisque, curieusement, c’est un sujet assez présent…
Tags: dictionnaire, données, métadonnées, mise à jour, qualité, temporel, tiers
14 février 2010 à 13:07
Petite erreur dans la première question \Si j’ai un jeu de données sans métadonnées, dois-je saisir les saisir ?\ (ce doit être l’effet de la neige sur la Défense). J’imagine que la question devait être \Si j’ai un jeu de données sans métadonnées, dois-je saisir les métadonnées ?\ ou \Si j’ai un jeu de données sans métadonnées, dois-je les saisir?\.
Sur le fond, je m’interroge pour savoir si des métadonnées saisies sur des données n’en disposant pas originellement, quelles sont les règles minimales à respecter (champs à saisir a minima par exemple).
Autre question concernant celle sur la gestion temporelle des métadonnées : le champ \Étendue temporelle\ semble attendre la saisie d’une date précise ou d’un intervalle. Mais pour des données concernant des périodes historiques anciennes voire la préhistoire, ces notions peuvent être très imprécises ou fournies avec des écarts de fiabilité des dates indiquées (exemple : radiodatations au C14 avec un écart de part et d’autre de la date calculée). Comment faire alors pour saisir de telles formats de dates ou de périodes chronologiques qui ne peuvent jamais être données sous la forme aaaa/mm/jj hh/mn/ss ??
Enfin je souligne l’importance cruciale de l’usage de dictionnaires de données, qui seuls peuvent permettre de limiter les écarts d’attribution de valeurs à certains champs des métadonnées lors d’une saisie par différents opérateurs.
15 février 2010 à 10:04
Merci pour l’alerte sur la faute de saisie.
Sur le fond :
– quelles règles minimales? Comme ces métadonnées ne sont qu’internes, cela dépend essentiellement des informations disponibles en interne sur les données. Cela peut être très variable. La généalogie, par exemple, ou l’échelle/précision de saisie sont souvent impossible à connaître.
– sur la gestion temporelle : cette discussion a eu lieu entre les géologues et les géomaticiens-de-notre-époque avant l’adoption des règles et de mémoire c’est géré. Je vais essayer de retrouver comment pour un prochain billet (si un géologue nous lis?).