Samedi 22 Juillet 2017

Challenge Ebbe-Nielsen 2017 du GBIF

Le GBIF Ebbe Nielsen Challenge 2017 décernera des prix pour un total de 14 000€  aux développeurs et scientifiques créant des outils pour améliorer l'accessibilité et l'interopérabilité des données de biodiversité disponibles dans les entrepôts de données libres, permettant ainsi de plus vastes explorations scientifiques et réutilisations de celles-ci.

Le Challenge repose sur l'adoption croissante de stratégies open data par les journaux scientifiques et les organismes de financement de la recherche. Afin de respecter ces règles, les chercheurs doivent mettre en libre accès les données à l'origine de leurs travaux, la plupart du temps en déposant leurs jeux de données dans des entrepôts de données en accès libre comme Dryad et Figshare.

Le Ebbe Nielsen Challenge 2017 demande aux participants de développer des applications web, scripts ou autres outils pour automatiser la découverte et l'extraction des données de biodiversité pertinentes dans les entrepôts de données en libre accès. Ces outils doivent permettre de générer des jeux de données prêts pour la publication sur le GBIF.org grâce à l'une des méthodes suivantes :

  • Recherche automatique de données ouvertes disponibles dans les entrepôts de données publics
  • Extraction efficace des informations nécessaires pour générer des checklists, des jeux de données d'occurrences d'espèces ou d'échantillonnage (par exemple nom scientifique, date, localisation de l'occurrence, etc.) à partir des jeux de données dans ces entrepôts
  • Correspondance (mapping)des en-têtes de colonnes et/ou de leur contenu avec les termes du standard Darwin Core
  • Conversion automatisée des données formatées en Archives Darwin Core prêtes pour la publication sur le GBIF.org

Beaucoup de jeux de données accessibles dans des entrepôts de données ont une structure tabulaire et contiennent les informations de base nécessaires à la génération de données d'occurrences d'espèces : noms scientifiques, dates, localisations géographiques, quantités, ainsi que d'autres éléments intéressants pouvant être standardisés. Si les jeux de données possèdent une licence CC0, CC BY ou CC BY-NC (utilisées dans le réseau GBIF), ils sont adaptés à être réutilisés, republiés et partagés (avec citation adéquate) avec un public très large de chercheurs du monde entier.

Les soumissions pour le Challenge doivent concevoir des processus pour préparer ces jeux de données au format Darwin Core Archive (DwC-A), qui permet actuellement la publication de quasiment 800 millions enregistrements d'occurrences d'espèces dans le réseau GBIF, qui comprend plus de 1000 institutions éditrices de données.

Le jury provisoire pour l'édition 2017 du Challenge inclut :

La période de soumission va du 15 juin au 05 septembre 2017. Les participants doivent enregistrer chaque membre de l'équipe sur DevPost, qui héberge tous les documents et règles liés au Challenge. Allez sur le site https://gbif2017.devpost.com pour plus de détails sur les conditions de participation.

Revenir en haut