Passer au contenu

Le modèle Excel STAR est un classeur Excel permettant de standardiser les données collectées lors des expérimentations en protection des cultures.

Il s’appuie sur un vocabulaire défini et harmonisé entre expérimentateurs. Les données sont structurées en tables cohérentes avec un modèle de données explicite.

Cette standardisation est nécessaire pour faciliter le partage, la mise en commun (méta-analyse) et la réutilisation des données. Elle permet aussi d’automatiser le traitement des données (analyses statistiques, visualisation, reporting).

Le modèle vierge et un exemple pré-rempli sont disponibles en ligne.

Le modèle permet d’organiser les données suivantes :

  • l’expérimentation : description et objectifs poursuivis
  • la parcelle : cépage, localisation
  • le plan d’expérience : modalité et placettes
  • les conditions météo
  • la traçabilité des traitements et des évènements survenus lors de l’essai
  • les données d’observation collectées

L’ensemble est accompagné d’un dictionnaire de données avec définitions, unités et types des valeurs attendues (texte, nombre, date).

Description de l’expérimentation

La description de l’expérimentation est réalisé dans la feuille expe (Table 1). La notion d’expérimentation est équivalente à celle d’un essai mené en protection phytosanitaire.

Les champs expe_id et expe_obj sont obligatoires. expe_id est l’identifiant de l’essai, à défaut son nom.

Tip

Une bonne pratique est d’identifier un essai selon une convention de nommage qui peut-être le site (ou plateforme), le nom de l’essai et l’année de réalisation, par exemple : IFV30_teisso_2024.

Il est possible de stocker les données de plusieurs expérimentations, à condition qu’elles soient réalisées sur la même parcelle agricole :

  • cas d’expérimentations différentes réalisées sur plusieurs années
  • cas de plusieurs expérimentations réalisées la même année, sur une même parcelle agricole (plateforme d’essais)
Table 1: Champs descriptifs de l’expérimentation (ou essai)
nom description_fr
organization_name Nom de l’institution responsable de l’expérimentation
suborganization_name Unité (appartenant à une organisation plus large).
email Email de la personne
expe_id Identifiant de l’expérimentation (URI ou autre)
expe_obj Objectif(s) de l’expérimentation
expe_desc Description de l’expérimentation et des objectifs poursuivis
expe_start_date Date de début de l’expérimentation. Elle est exprimée au format AAAA-MM-JJ suivant la norme internationale ISO 8601.
expe_end_date Date de fin de l’expérimentation. Elle est exprimée au format AAAA-MM-JJ suivant la norme internationale ISO 8601.
design_plan Type de plan d’expérience
proj_id Identifiant du projet (URI ou autre)

Note

Les champs obligatoires indiqués en gras et en jaune dans chaque feuille du fichier modèle.

Le contexte expérimental

Description de la parcelle

La parcelle sur laquelle ont lieu la ou les expérimentations est décrite dans la feuille du même nom (Table 2). Aucune donnée n’est obligatoire ici, mais la localisation de la parcelle est recommandée. Le cépage est sélectionnable dans une liste déroulante, si cette liste s’avère incomplète, il est possible de saisir librement. Dans ce cas, faites une demande au gestionnaire du fichier.

Table 2: Champs descriptifs de la parcelle
nom description_fr
field_id Identifiant de la parcelle expérimentale (URI ou autre)
field_name Nom (ou code) de la parcelle sur laquelle l’expérimentation a lieu
cultivar_name Nom de la variété (et clone si connu) produisant les fruits. Format de type “Syrah N Cl300” ou “Grenache B”. Utiliser la nomenclature de https://www.plantgrape.fr/fr
row_spacing Ecartement entre les rangs de vigne, en m
plant_spacing Ecartement entre les ceps de vigne sur le rang, en m
commune_name Nom de la commune sur laquelle se trouve la parcelle
commune_insee_id Code INSEE de la commune (5 caractères alphanumériques)
field_latitude Latitude du centroïde de la parcelle (degrés décimaux WGS84)
field_longitude Longitude du centroïde de la parcelle (degrés décimaux WGS84)

Les conditions climatiques

Les conditions climatiques dans lesquelles s’est déroulée l’expérimentation sont stockées dans la feuille meteo. Les données peuvent être journalières ou horaires selon les cas. Certaines variables sont proposées par défaut (Table 3), mais ne sont pas nécessairement toutes renseignées. De même, il est possible d’ajouter de nouvelles variables. Il est possible de supprimer les colonnes inutilisées.

Table 3: Champs descriptifs des conditions météorologiques
nom description_fr
meteo_datetime Date (heure) de l’observation météo. Format AAAA-MM-JJ ou AAAA-MM-JJ HH:MM
air_tmean_celsius Température moyenne de l’air sur la période de mesure en degrés Celsius
air_tmax_celsius Température maximale de l’air sur la période de mesure en degrés Celsius
air_tmin_celsius Température minimale de l’air sur la période de mesure en degrés Celsius
rain_mm Pluie sur la période de mesure en mm
air_hmean_p Humidité relative moyenne de l’air sur la période de mesure en pourcentage.
air_hmax_p Humidité relative maximale de l’air sur la période de mesure en pourcentage.
air_hmin_p Humidité relative minimale de l’air sur la période de mesure en pourcentage.

Important

Si vous ajoutez des variables, pensez à compléter le dictionnaire de données !

Le plan d’expérience

Les modalités

Les traitements expérimentaux, communément appelés modalités, sont décrits dans la feuille modalite (Table 4).

Ils sont associés à une expérimentation : en cas de partage de certaines modalités entre différents essais, il faudra dupliquer la modalité pour avoir une déclaration complète des modalités suivies dans chaque essai.

Table 4: Champs descriptifs des traitements expérimentaux
nom description_fr
expe_id Identifiant de l’expérimentation (URI ou autre)
xp_trt_code Code de la modalité (traitement expérimental)
xp_trt_name Nom court de la modalité (traitement expérimental)
xp_trt_desc Description et commentaires sur le traitement expérimental

Les placettes

La feuille placette permet de déclarer les placettes et leur position sur la parcelle (Table 5). Une placette est un ensemble de plants de vigne qui reçoivent un même traitement expérimental. Autrement dit, ce sont les unités expérimentales de l’essai.

Chaque placette doit avoir un identifiant unique, qui ne peut pas être répétés dans la parcelle. On peut par exemple faire une combinaison du code du bloc et du code de la modalité, (à condition de n’avoir qu’une répétition par bloc !).

Tip

Pour numéroter les placettes (ou unités expérimentales), il est recommandé d’adopter un code alphanumérique du type P1, P2, …, Pn avec une numérotation incrémentale. Cela évite d’être influencé dans les notations.

Table 5: Champs descriptifs des placettes
nom description_fr
plot_id Code de la parcelle unitaire (ou élémentaire) permettant son identification unique au sein de l’expérimentation
xp_trt_code Code de la modalité (traitement expérimental)
block_code Code du boc sur la quelle est située l’unité expérimentale. Un bloc regroupe plusieurs unités expérimentales. Les blocs sont utilisés pour réduire la variabilité expérimentale et améliorer la précision des comparaisons entre les traitements.
plot_x Position de la parcelle unitaire en coordonnées relatives x. Typiquement, cela peut être un numéro de rang.
plot_y Position de la parcelle unitaire en coordonnées relatives y. Typiquement, cela peut être le numéro de la 1er souche de la placette à partir du début du rang.
plot_n Nombre de ceps dans la parcelle unitaire
plot_desc Description ou commentaire sur la placette

Tip

Copier-coller dans cette feuille une image du plan d’expérience pour le visualiser facilement. Il est possible de générer cette image avec le package R startbox.

Traçabilité et évènements

Les traitements phytosanitaires

Chaque traitement phytosanitaire appliqué doit être enregistré dans la feuille ppp (Table 6) La saisie se fait par modalité. En cas de traitement de couverture, concernant toutes les modalités, il est nécessaire de dupliquer les lignes pour déclarer le traitement de couverture pour chaque modalité.

Le nom du produit et son numéro d’AMM peuvent être trouvés sur le site e-phy.

Table 6: Champs descriptifs des traitements réalisés
nom description_fr
p_app_code Code de l’application, généralement séquentiel pour les traitements (T1, T2 …)
xp_trt_code Code de la modalité (traitement expérimental)
p_app_date Date d’application du produit phytosanitaire
bbch_stage Stade phénologique lors de la mesure (échelle BBCH)
p_name Nom du produit phytosanitaire
p_amm Numéro d’Autorisation de Mise sur le Marché du produit phytosanitaire
p_dose Dose de produit phytosanitaire appliqué
p_dose_unit Unité de la dose de produit appliquée
p_operator Personne ayant réalisée l’application
sprayer_name Nom ou code du pulvérisateur utilisé
p_app_vol_rate Volume hectare appliqué lors d’un traitement, en L/ha

Les évènements

La feuille evenement (Table 7) permet d’enregistrer toute sorte d’évènements pouvant survenir au cours de l’essai selon les différents types suivants :

  • accident climatique : un accident de type gel, grêle…
  • incident technique : tout problème pouvant affecter la bonne conduite de l’expérimentation
  • inoculation : opération d’inoculation, en particulier pour les expérimentations en plateforme de brumisation inoculée avec du mildiou
  • note : toute note ou remarque utile
  • observation : action d’observation réalisé sur l’expérimentation.

Le champ event_description permet de préciser la nature de l’évènement, et les éventuelles implication pour l’essai.

Table 7: Champs descriptifs des évenements
nom description_fr
event_date Date (et heure) de l’événement
event_type Type d’évenement survenu lors de l’expérimentation : accident climatique, accident ou incident technique…
event_description Description libre de l’événement

La traçabilité du fichier

Les actions sur le fichier sont elles-mêmes enregistrées dans une feuille dédiée à la traçabilité, nommée suivi_data (Table 8). Ces actions sont enregistrées soit manuellement par l’opérateur, soit automatiquement en cas de manipulation du fichier via le package startbox.

Le principe est de décrire la source des données, la nature de l’action effectuée, par qui et quand, et les données résultantes.

Table 8: Champs descriptifs des actions sur le fichier
nom description_fr
dataop_date Date de l’opération sur les données
dataop_desc Description de l’opération réalisée sur les données (importation, mise à jour…)
dataop_agent Opérateur réalisant la manipulation des données
dataop_input Nom de la source des données (Par exemple TopVigne, POM…). Pour une feuile Excel, nom de la feuille
dataop_output Nom de la table de donnée en sortie de l’opération sur les données (nom de la feuille sous Excel)

Les données observées

Les données observées sont enregistrées dans une ou plusieurs feuilles du classeur. Le nom d’une feuille de donnée doit obligatoirement commencer par le préfixe data_. Dans le cas contraire, elle ne sera pas lue par le package startbox.

Chaque observation doit être associée à une placette plot_id, est réalisée à une date et un stade phénologique donné, et associé à une ou plusieurs variables observées (Table 9).

Les stades phénologiques sont déclarés dans l’échelle BBCH.

Les variables doivent être déclarées dans le dictionnaire de données. Certaines sont déjà enregistrées par défaut dans ce dictionnaire.

Table 9: Champs descriptifs des feuilles de données
nom description_fr
observation_date Date de réalisation de l’observation.
bbch_stage Stade phénologique lors de la mesure (échelle BBCH)
plot_id Code de la parcelle unitaire (ou élémentaire) permettant son identification unique au sein de l’expérimentation

Le dictionnaire de données

Le dictionnaire de données est dans la feuille dictionary. Le principe est de décrire toutes les colonnes (variables) existantes dans le fichier. Chaque colonne est décrite par :

  • nom : son nom de colonne
  • description_fr : une description en français expliquant son contenu
  • trait : dans le cas d’une variable, le trait associé à la variable. Le trait est la caractéristique observée sur une entité, par exemple la hauteur de plante.
  • method : la méthode de mesure ou d’observation
  • unit : l’unité dans laquelle est exprimée la variable
  • Rclass : sa classe dans l’environnement R (character, numeric, date, integer)
  • uri : l’identifiant de type URI de la variable
  • is_variable : s’il s’agit d’une variable mesurée (ou observée)
  • has_eloa_class : la classe associée de l’entité décrite par le champ.