Référentiel

Wikis > Ecoinformatique > Référentiel

Contexte et objectif

L'utilisation d'informations standardisées concernant les données écologiques facilite à la fois la mise en forme des fichiers, leur analyse et la maintenance dans le temps de ces fichiers et des méta-données associées. L'objectif de cette page est de faciliter ces tâches en présentant un référentiel de noms de variables parmi les plus utilisées. Il est difficile d'être exhaustif a priori, car de nouvelles approches peuvent être utilisées pour produire de nouvelles mesures et des variables "inédites" associées. Par construction ce référentiel constitue donc une ressource évolutive destinée à être enrichie au cours du temps.

Description

Définition d'une variable

Le référentiel prend la forme d'un fichier "tableur" (spreadsheet) à plusieurs feuilles contenant chacune un ensemble de variables cohérent, dans le sens où elles concernent un même type d'objets (individu, parcelle, organe, etc), dans la mesure du possible. Dans chaque ensemble, chaque variable est caractérisée par au moins deux informations contenues dans deux colonnes :

  • un label constituant la référence principale : c'est ce label qui est utilisé comme titre de colonne dans les différents tableaux de données pour désigner les informations contenues dans la colonne,
  • une description de la variable expliquant brièvement la nature de la variable.

Ces deux colonnes constituent l'information minimale pour décrire une variable : elles sont nécessaires, et donc obligatoires pour que le référentiel soit utile.

Informations complémentaires

Selon la nature de la variable considérée, il peut être utile, voire nécessaire, d'indiquer d'autres propriétés. Parmi ces propriétés, les plus courantes sont :

  • le type de variable : indique si la colonne du jeu de données contient des valeurs numériques, des chaînes de caractère, des dates, ou des heures,
  • l'unité de mesure : concerne les variables continues, l'unité utilisée suit le système international de référence autant que possible (il peut toutefois être utile d'utiliser une unité différente pour faciliter le formatage des valeurs numériques),
  • les valeurs possibles, c'est-à-dire pouvant être prises par la variable : concerne les variables catégorielles (= qualitatives = facteurs au sens statistique, ordonnés ou non). Les valeurs possibles indiquent les modalités prises par la variable lorsqu'elles sont connues ou fixées à l'avance : cela concerne par exemple différents traitements dans une expérience en conditions contrôlées. Cela ne concerne pas en revanche les informations taxonomiques, les taxons observés n'étant pas nécessairement connus.

    Contenu

    Le référentiel est organisé en blocs de variables décrits dans des feuilles séparées. Chaque feuille correspond à un bloc. Le référentiel contient actuellement (27/09/2017) les blocs suivants : observation, taxo, bioeco, plante, enviro, angiospermes, bryophytes, et insectes (à construire). L'ensemble des blocs est décrit sur une feuille particulière appelée notes, à consulter en premier !

    Lien vers le référentiel

    Référentiel "Variables" (au 27/09/2017)

Ce contenu a été publié par . Mettez-le en favori avec son permalien.