Samedi 22 Septembre 2018

données

Le GBIF.org a dépassé le milliard d’enregistrements d’occurrences d’espèces le 4 juillet 2018, grâce à une série de données provenant de l’Inventaire National du Patrimoine Naturel, incluant cette observation d’une anémone à collerette (Metridium dianthus) près de Saint-Pierre et Miquelon, archipel français dans l’Atlantique Nord-Ouest. L’enregistrement de cet animal invertébré marin est l’un des 150 097 récoltés par BioObs (Base pour l’inventaire des observations subaquatiques), un outil scientifique citoyen qui permet aux plongeurs d’en apprendre davantage sur l’environnement marin tout en contribuant à un inventaire national des espèces sous-marines.

Cette étape symbolise une réalisation collective majeure, rendue possible grâce au travail du réseau GBIF, un partenariat diversifié de plus de 1.200 organisations publiques et privées du monde entier issues de 123 pays.

La France y contribue activement et se place en 5e position des pays fournisseurs de données au GBIF. Cela grâce au travail de l’ensemble des producteurs nationaux : 50 éditeurs français (Muséums, Instituts de recherche, Associassions, Universités…) qui partagent actuellement plus de 549 jeux de données avec l’aide apportée par l’équipe du GBIF France, intégré dans l’UMS PatriNat.  

PatriNat qui contribue aujourd’hui  à passer le cap du milliard grâce au travail de l’ensemble des naturalistes bénévoles ou professionnels qui alimentent, dans le cadre du SINP, la plateforme nationale des données de biodiversité portée par l’INPN

 

Plus d'information sur le GBIF.org (en français) sur cette page et sur les réseaux sociaux :

 

 

Frilled anemone (Metridium dianthus). Photo by B. Guichard, Agence Française pour la Biodiversité, licensed under CC BY-NC-SA 4.0

Le Musée des Confluences, partenaire du GBIF depuis octobre 2017, a récemment mis en ligne trois jeux de données provenant de ses collections naturalistes : les Rhopalocères de Martinique, les Nymphalidae Ithomiinae et une collection de Cirripèdes.

Ces jeux de données représentent un total de plus de 1700 données sur la biodiversité librement accessibles en ligne.

 

Ces nouvelles données sur les Invertébrés seront également accessibles sur le portail français du GBIF très prochainement.

 

Pour plus d'informations, vous pouvez consulter la page dédiée au Musée des Confluences sur le site du GBIF.

Grâce au nouveau validateur de données du GBIF, les éditeurs de données peuvent améliorer la qualité de leurs jeux de données : le logiciel identifie les problèmes potentiels avant la phase de publication, permettant ainsi à l'utilisateur de les corriger.

L'équipe informatique du Secrétariat du GBIF a développé une version «early release» du service avec pour objectif de l'améliorer, en grande partie grâce au retours des utilisateurs. Le service effectue les mêmes contrôles que ceux effectués après la publication des jeux de données sur le GBIF.org. Cela permet de signaler des erreurs avant la publication.
C'est également le premier outil permettant d'interpréter et de valider le contenu d'un jeu de données ainsi que sa structure.

Les utilisateurs qui chargent un jeu de données (en utilisant un des formats acceptés) dans le validateur reçoivent rapidement un rapport.
Celui-ci interprète le jeu de données et met en évidence les problèmes potentiels concernant son contenu, sa syntaxe et sa structure.
Les types de fichiers pris en charge incluent :
    - les archives Darwin Core (DwC-A)
    - les modèles de jeux de données GBIF standard
    - les fichiers CSV simples qui contiennent des termes Darwin Core dans leur première rangée.

Ceux qui souhaitent valider de grands jeux de données peuvent également soumettre des URL de jeux de données.

Le temps de traitement varie en fonction de la taille du jeu de données. Toutefois, étant donné que chaque nouveau processus de validation génère un identifiant unique de travail, les utilisateurs disposant de grands jeux de données, ou limités dans le temps, peuvent mettre en "marque-page" l'URL de leur rapport et y revenir plus tard.

Chaque rapport de validation contient:

    - un résumé rapide du jeu de données qui indique si le GBIF.org peut indexer le fichier avec succès ou non
    - un aperçu des problèmes d'interprétation du GBIF pour le jeu de données
    - un résumé détaillé de tous les problèmes rencontrés avec les métadonnées, le coeur du jeu de données et ses extensions
    - le nombre d'enregistrements interprétés avec succès
    - la fréquence des termes utilisés dans le jeu de données
    
Les utilisateurs du validateur de données peuvent également voir comment leurs métadonnées apparaîtront une fois celle-ci publiées sur le GBIF.org.

Les utilisateurs, dont les rapports de validation permettent d'identifier les problèmes bloquants liés à l'indexation de leurs jeux de données, peuvent se concentrer sur la résolution de ceux-ci avant de procéder à la publication.
Dans le même temps, les utilisateurs dont les jeux de données ont été validés peuvent examiner attentivement d'autres problèmes moins graves ou des erreurs de conversion et ainsi améliorer encore la qualité de leurs données.
Tous les utilisateurs sont encouragés à envoyer des jeux de données dans le validateur, que les erreurs qu'ils souhaitent détecter soient importantes, systématiques ou uniques.

Comme tous les outils GBIF, le validateur de données est un logiciel open-source, avec son code source et sa documentation disponibles dans le dossier GitHub du projet.

Cliquez sur les liens suivants pour en savoir plus sur le validateur de données ou, mieux encore, comment mettre l'outil à disposition. Les retours des utilisateurs seront à la fois bienvenus et essentiels pour affiner ce service et aider les éditeurs de données à résoudre les problèmes potentiels avec leurs jeux de données, de manière rapide et efficace.

 

Plus d'informations ici (en anglais)

 

Hachemort à la tête de la mort (Acherontia atropos) avec des abeilles mellifères (Apis melifera). Photo de blingbeek via des observations d'iNaturalist Research sous licence CC BY-NC 4.0.

L'Unité Expérimentale d'Ecologie et d'Ecotoxicologie Aquatique (U3E) du centre INRA de Rennes a partagé sur le site GBIF.org, en partenariat avec d'autres centres INRA, l'ONEMA et la FDPPMA56, trois jeux de données sur les traits biologiques des saumons atlantiques juvéniles prélevés au cours d'un relevé d'abondance dans trois rivières de France : l'Oir en Normandie (mise à jour d'un jeu de données déjà publié dans le GBIF), le Scorff en Bretagne, et la Nivelle en Nouvelle-Aquitaine. Au total, ces trois jeux de données représentent plus de 46 000 données de biodiversité librement accessibles.

Ces nouvelles données sur l'espèce Salmo salar seront également bientôt accessibles sur le portail français du GBIF.

L'INRA a également publié dans le réseau GBIF de nombreux autres jeux de données issus de plusieurs centres et unités de l'institut.

L'Institut de Recherche pour le Développement (IRD) a récemment publié un nouveau jeu de données de près de 29 000 occurrences dans le réseau GBIF. Ce jeu de données regroupe des observations provenant de la partie "Pêches expérimentales" du système d'informations PPEAO (Peuplements de poissons et Pêche artisanale des Ecosystèmes estuariens, lagunaires et continentaux d'Afrique de l'Ouest) de l'IRD. Il comprend les occurrences de 307 taxons de poissons, crustacés et mollusques, collectées lors de campagnes de pêches d'échantillonnage mises en œuvre par l'IRD dans différents écosystèmes aquatiques d'Afrique de l'Ouest entre 1979 et 2013. 

Le jeu de données est consultable et téléchargeable sur le site GBIF.org ainsi que sur le portail français d'accès aux données.

 

L'IRD a également publié dans le réseau GBIF de nombreux autres jeux de données issus de plusieurs centres et unités de l'institut.

Revenir en haut