1 Introduction
Ce standard a été proposé dans le cadre du projet VITIS DATA CROP (CASDAR RT 2020) et a fait l’objet d’une publication lors du congrès de l’OIV 2023 (Delpuech, Xavier et al. 2023). Ce projet a pour objectif de proposer un ensemble cohérent d’outils et des méthodes pour améliorer l’interopérabilité, le partage et l’ouverture des données.
Notre objectif est de proposer un schéma de données adapté à la description du contexte d’acquisition des données expérimentales au vignoble. Ce schéma de données est constitué d’une liste structurée d’entités, avec leur signification et les champs permettant de les décrire. Pour chaque champ, le schéma définira les valeurs qu’il est possible d’attribuer (terme issu d’une liste par exemple). In fine, il s’agit de faciliter l’interopérabilité des jeux de données produits par la communauté scientifique et technique vigne et vin qui pourront s’aligner avec ce schéma, ouvert et partagé.
Un schéma de données ou modèles de données décrit comment les données sont organisées dans la base de stockage de données d’un système d’information. Un schéma de données est composé d’entités liées entre elles par des relations. Par exemple, une parcelle est une entité du schéma de donnée OSCAR.
Des champs (ou attributs) décrivent chaque entité. Par exemple, la « densité de plantation » est un champ descriptif d’une parcelle viticole.
Les vocabulaires sont les valeurs possibles des champs définis dans le schéma. Par exemple, le champ « variété » peut s’appuyer sur une liste (le vocabulaire) de variétés.
Un atelier autour du vocabulaire expérimental s’est tenu le 19 janvier 2023 lors du séminaire organisé dans le cadre de ce projet. Cet atelier a permis de collecter un ensemble de termes dans différents contextes.
Ces éléments ont été complétés par une revue de l’existant, en analysant les métadonnées proposées dans les systèmes d’informations existants :
- Silex Porte-greffe : système d’information qui a pour objectif de rassembler les données expérimentales existantes (en pépinière et au vignoble) sur les porte-greffes utilisés en viticulture (seule la partie vignoble a été analysée).
- Oscar : dispositif participatif, constitué d’un réseau de parcelles en production plantées par les viticulteurs et suivis par des techniciens. Une base de données regroupant les informations est stockée sur la plateforme Epicure de l’IFV.
- Ocesar : système d’information centralisant les informations issues du réseau d’observations régional des parcelles de variétés innovantes, en région SUD.
- Sinfonia : système d’information IFV pour la gestion des données expérimentales vigne et vin
- Adonis : outil de collecte de données expérimentale INRAE (Equipe projet Adonis 2013)
- (VitisExplorer)
Cette revue a été complétée par des approches similaires conduites lors de projets de mise en réseau : Recap&Dep (Projet PNDV) ou le format MIAPPE, plus générique (Krajewski et al. 2015).
L’objectif n’est pas d’être exhaustif sur les métadonnées existantes dans ces différents projets, mais de proposer une sélection de métadonnées en recherchant un consensus de la communauté scientifique et technique vigne.
La version actuelle de ce guide s’attache à proposer une description du contexte d’acquisition des données expérimentales, sans aller jusqu’au données mesurées sur le terrain par les expérimentateurs. En ce sens, nous n’avons pas inclus de proposition de champs descriptifs des objets mesurées (parcelles unitaires, ceps, organes, sol …). Les entités identifiées et décrites dans la suite de ce guide sont reprises sur Figure 1.1
Ce travail devra être complété dans un second temps pour permettre d’associer les données à cette description du contexte. On peut à ce titre déjà souligner l’importance d’associer un dictionnaire de données explicitant les variables mesurées. Ces variables doivent être à chaque fois que c’est possible reliées à la Vitis Ontology(Duchêne et Pommier 2019).