Mardi 26 Octobre 2021

informatique

Un ensemble de données contenant près de 1,3 milliard d'enregistrements d'occurrences d'espèces du réseau GBIF est désormais disponible à l'utilisation via le catalogue de données du Planetary Computer de Microsoft. Actuellement composé d'enregistrements sous licence ouverte et géoréférencés, partagés par le GBIF jusqu'à la mi-avril, cet aperçu fournit aux utilisateurs de l'environnement du cloud numérique Microsoft Azure un accès facile aux données primaires de biodiversité dans des formats cohérents et prêts à l'analyse.

Développé par Microsoft AI for Earth, le Planetary Computer combine des pétaoctets de données de surveillance environnementale à l'échelle mondiale et les rend facilement accessibles aux utilisateurs du système de calcul virtuel à grande échelle. Documentation, exemple de cahier et un billet de l'analyste de données du GBIF John Waller sur le Blog GBIF Data décrit comment les utilisateurs peuvent commencer à accéder aux données diffusées par le GBIF à partir du stockage en blob sur Azure, que ce soit à l'intérieur ou à l'extérieur du Planetary Computer.

 

L'entrée dans le catalogue du Planetary Computer est opportune, étant donné son potentiel pour soutenir les demandes de subvention des premiers utilisateurs pour un montant allant jusqu'à 60 000 dollars américains à la fois en financement et en crédits de calcul ainsi que d'autres ressources par le biais du programme du Planetary Computer de GEO-Microsoft. La date limite pour soumettre des propositions de recherche de 12 mois appliquant le Planetary Computer aux grands défis environnementaux décrits dans l'actuel programme de travail du Group on Earth Observations (GEO) est le 15 juin 2021.

« L'accès systématique à une collection complète et actualisée d'occurrences d'espèces par le biais de l'ordinateur planétaire améliorera considérablement la contribution que le réseau GBIF peut apporter à l'élaboration d'indicateurs pour le Cadre mondial pour la biodiversité post-2020 de la Convention des Nations unies sur la diversité biologique, » a déclaré Simon Ferrier, chercheur en chef au CSIRO, l'agence scientifique nationale australienne.

Ferrier, le codirecteur du projet, Andrew Hoskins, et leurs collègues développent une solution qui applique des outils d'apprentissage automatique de pointe sur la plateforme Azure pour extraire le signal du changement de la biodiversité à partir de masses de données d'observation moins structurées. Cela n'est possible que grâce à la colocalisation des données du GBIF et des données de télédétection sur l'occupation des sols et le changement climatique, ainsi qu'à la capacité de calcul à haute performance qu'offre la plateforme de calcul du cloud Azure », a déclaré M. Hoskins. « Cette approche ouvre de toutes nouvelles possibilités de surveillance des changements dans la biodiversité de notre planète »

 

Le secrétariat du GBIF a pour objectif de mettre à jour les échantillons tous les mois, afin de suivre le rythme des données dynamiques et en constante évolution, disponibles via GBIF.org et l'API GBIF. Leséchantillons continueront à inclure tous les enregistrements partagés par le GBIF sous les désignations CC0 et CC BY dont les coordonnées ont passé les contrôles de qualité automatisés.

Ce premier échantillon contient des enregistrements sur 939 601 espèces provenant de 22 517 ensembles de données et de 1 029 institutions d'édition de données. Comme tous les ensembles de données partagés par le GBIF, a été attribué un DOI, ou identifiant d'objet numérique, qui maintient un enregistrement persistant et transparent de ses sources. Étant donné le succès du Secrétariat dans le développement de l'un des principaux systèmes mondiaux de citation et d'attribution des données, la préservation de la provenance est restée une priorité tout en introduisant les données dans de nouvelles communautés de recherche et de calcul.

À cette fin, les développeurs du GBIF ont créé un nouveau service qui produit des enregistrements citables de "jeux de données dérivés" et permet aux utilisateurs du cloud numérique de suivre les directives de citation et les meilleures pratiques. Le coordinateur des communications scientifiques Daniel Noesgaard a décrit l'outil dans le blogue sur les données du GBIF. Cet outil est disponible à la fois via l'API du GBIF et l'interface GBIF.org et permet aux utilisateurs de tenir compte du fait qu'ils peuvent effectuer des analyses sur une partie considérablement filtrée des données disponibles dans un échantillon donné. Le fait de citer le DOI attribué à l'ensemble de données dérivées qui en résulte améliorera la précision et le suivi des citations tout en garantissant la transparence et la reproductibilité des analyses.

 

D'autres sont prévus pour un échantillon similaire déjà placé dans le Registre des données ouvertes sur Amazon Web Services et un autre en cours de préparation pour être inclus dans les ensembles de données publiques disponibles via Google BigQuery. Pris ensemble, ces développements signalent la première étape vers l'activation des systèmes d'informatique dans un cloud pour « aider à encourager la recherche novatrice, réduire les obstacles techniques de l'analyse des données à grande échelle et accroître la visibilité » du réseau GBIF, comme le chef de l'informatique du GBIF Tim Robertson suggère en février 2021.

 

Chiffres en avril 2021

 

Règne Nombre d'espèces Nombre d'enregistrements
Animalia 531 074 1 064 194 305
Plantae 315 369 193 391 585
Fungi 64 291 12 210 273
Chromista 18 113 9 440 667
Bacteria 8 364 13 313, 089
Protozoa 1 635 793 176
Virus 383 42 019
Archaea 216 226 905
incertae sedis 164 4 223 619
TOTAL 939 601 1 297 835 638

 

 

Chauve-souris à queue libre du Brésil (Tadarida brasiliensis), États-Unis Photo 2021 Caitlin Campbell via iNaturalist Research-grade Observations, sous licence CC BY-SA 4.0

 

Lire l'article original

Le défi Ebbe Nielsen

Le défi GBIF Ebbe Nielsen est un prix d'encouragement annuel qui vise à inspirer des applications innovantes de données sur la biodiversité en libre accès par des scientifiques, des informaticiens, des modélisateurs de données, des cartographes et d'autres experts.

 

L'appel à candidatures pour le défi Ebbe Nielsen 2021 du GBIF est maintenant ouvert - la date limite pour les soumissions est fixée au 2 août 2021!

 

Comme le prix Ebbe Nielsen qu'il a remplacé, le défi honore la mémoire du Dr Ebbe Schmidt Nielsen, un leader inspiré dans les domaines de la biosystématique et de l'informatique de la biodiversité et l'un des principaux fondateurs du GBIF, qui est décédé tragiquement juste avant sa création.

Bien que l'objectif du concours ait évolué d'année en année, les candidatures au défi présentent une variété de formes et d'approches - nouvelles recherches analytiques, visualisations plus riches et pertinentes pour les politiques, applications web et mobiles, ou améliorations des processus de numérisation, de qualité et d'accès aux données.

 

Gagnants du défi Ebbe Nielsen

2020

 

Prix Projet Bénéficiaire(s) Pays
1er ShinyBIOMOD
Une application R pour la modélisation de la distribution des espèces
Ian Ondo
Alexandre Antonelli

Wilfried Thuiller
Maya Gueguen
Samuel Pironon

Royaume-Uni
Royaume-Uni / Suède
France
France
Royaume-Uni
2e Relier la nomenclature aux spécimens types Maarten Trekels Belgique
2e InteractIAS
Un carnet de notes Jupyter pour soutenir l'évaluation experte des risques liés aux espèces envahissantes
Quentin Groom Afrique du Sud
3e Navigateur de codes-barres ADN Roderic Page Royaume-Uni
3e Voyager Ivvet Abdullah-Modinou
Ben Scott
Royaume-Uni

Royaume-Uni

3e Outil de géoréférencement de masse Luis J. Villanueva États-Unis

 

 

Orchidée Calypso (Calypso bulbosa) Photo J. Brew / Flickr, sous licence CC BY-SA 2.0

 

Lire l'article original

 

Du 24 au 27 juillet 2018, un groupe de plus de 100 parties prenantes sont invitées à se réunir à Copenhague pour discuter d'un mécanisme de coordination internationale pour l'informatique de la biodiversité.

 

Une tâche sera d'explorer comment un tel mécanisme de coordination pourrait fonctionner. Son potentiel concernant l'accélération de la fourniture d'infrastructures de données, de biodiversité mondiale, liées et ouvertes, au profit de la science et de la société, sera également étudié.

 

Les participants de la deuxième conférence mondiale sur l'informatique de la biodiversité (GBIC2 en anglais), vont étudier les obstacles à la gouvernance, la confiance, aux facteurs techniques et sociologiques et au financement durable d'un tel mécanisme.

 

La première conférence du GBIC a eu lieu à Copenhague, au Danemark, en juillet 2012 et a conduit à la publication du Global Biodiversity Informatics Outlook, ou GBIO. Il présentait une vision des principaux domaines dans lesquels l'informatique de la biodiversité devait progresser.

 

La vision de GBIO reste toujours aussi pertinente aujourd'hui, étant donné que la communauté scientifique continue de faire face à l'ampleur de :

  • la tâche de décrire la diversité de la vie ;
  • documenter la complexité de ses fonctions ;
  • améliorer la planification des ressources naturelles à toutes les échelles.

Tout cela dans l'objectif de réaliser les objectifs de développement durable.

 

La connaissance et la compréhension de la biodiversité peuvent et doivent être organisées en tant que ressources numériques liées, ouvertes, accessibles et résilientes qui répondent à tous ces besoins.

 

Dans les années qui ont suivi le premier événement GBIC, alors que la communauté mondiale a fait des progrès significatifs dans certains domaines, les progrès restent inégaux. De nombreux facteurs y contribuent : culturels, sociologiques et techniques, mais l'un des principaux problèmes est la nature du financement de l'activité concernée. Les chercheurs et les praticiens font progresser l'informatique de la biodiversité principalement à travers des projets de petite et moyenne envergure, initiés en réponse aux intérêts et aux priorités locales. Une situation qui entraîne une prolifération de normes, d'outils et de processus qui ne se combinent pas pour former un tout interopérable.

 

Pour garder ses discussions initiales sur des questions pratiques, GBIC2 se concentrera sur des sessions parallèles qui explorent quatre domaines de composants du GBIO. Il se concentrera également sur les défis qui apparaîtront dans l'élaboration des priorités et sur une feuille de route pluriannuelle pour chacun :

 

Des efforts récents ont identifié à plusieurs reprises la nécessité pour les acteurs de l'informatique de la biodiversité de collaborer à l'échelle mondiale, cela afin d'identifier les priorités communes et coordonner la mise en œuvre de ces priorités.

 

    Il y a un besoin évident d'un mécanisme ouvert et fiable qui permette à la communauté internationale de développer une vision partagée pour chacun des domaines de la GBIO, et de se mettre d'accord sur les principaux éléments et composants qui doivent être priorisés pour réaliser ces visions.

 

Une fois ces priorités convenues, une coordination continue pourrait permettre à la communauté de soutenir les efforts des agences et des institutions de différents pays pour obtenir des financements et mettre en œuvre ces composantes.

 

Bien que la participation soit nécessairement limitée et que les discussions se déroulent entièrement en anglais, GBIC2 n'est que la première étape d'un processus de consultation plus large. Après l'atelier, les recommandations et les résultats de ses discussions seront traduits en plusieurs langues et largement partagés. Après quoi, toutes les parties prenantes intéressées par l'avenir de l'informatique de la biodiversité seront encouragées à critiquer et à améliorer les propositions.

 

Page originale (en anglais) ici

Revenir en haut