Vendredi 03 Mai 2024

Les efforts de traduction collaborative facilitent l'engagement avec les détenteurs francophones d'informations génomiques et métagénomiques

 

Les membres de la communauté des traducteurs bénévoles de cinq nœuds francophones du GBIF ont terminé la première traduction du guide, Publishing DNA-derived data through biodiversity data platforms, en français - Publier des données dérivées de l'ADN sur les plateformes de données sur la biodiversité.

Contribuant à l'effort de mise à disposition de cette documentation à la communauté francophone, Sofia Wyler du GBIF Suisse, a commenté le guide :

 

« Les données dérivées de l'ADN sont un type de données assez spécifique et les concepts qui sous-tendent leur publication dans le GBIF peuvent être déroutants et décourageants. En fournissant une version française des directives, nous espérons contribuer à rendre le processus de publication de ce type de données plus accessible aux francophones, qu'ils soient gestionnaires de nœuds ou fournisseurs de données potentiels. Lors de la traduction, nous avons détecté quelques difficultés de la part de collègues qui n'étaient pas familiers avec les données dérivées de l'ADN, et nous espérons que notre effort profitera à la communauté au sens large. L'objectif est que davantage de données de qualité dérivées de l'ADN puissent être mises à disposition sur GBIF afin d'améliorer notre connaissance de la biodiversité et l'utilité de données autres que les données typiques traitées par la plateforme. »

 

L'équipe transfrontalière de traducteurs et de réviseurs était composée de :

Publiée l'année dernière, cette documentation numérique vise à fournir aux détenteurs d'informations génomiques et métagénomiques des considérations pratiques pour refaire surface les occurrences dérivées de l'ADN dans les plateformes de données sur la biodiversité comme GBIF.org.

Le guide représente la prochaine étape des efforts du GBIF pour connecter son infrastructure de données et ses outils aux sources pertinentes d'informations génomiques et métagénomiques, en s'appuyant sur des collaborations avec la communauté UNITE, l'Institut européen de bioinformatique de l'EMBL (par le biais de ses archives européennes de nucléotides et de sa plateforme MGnify), et l'International Barcode of Life Consortium (IBOL).

 

Appel ouvert aux traducteurs bénévoles ! Si vous souhaitez consulter ces documents ou d'autres documents d'orientation du GBIF dans votre langue, n'hésitez pas à nous envoyer un e-mail à communication@gbif.org pour savoir comment rejoindre notre communauté de traducteurs bénévoles.

 

Citation

Andersson AF, Bissett A, Finstad AG, Fossøy F, Grosjean M, Hope M, Jeppesen TS, Kõljalg U, Lundin D, Nilsson RN, Prager M, Svenningsen C & Schigel D (2022) Publier des données dérivées de l'ADN sur les plateformes de données sur la biodiversité (Wyler S, Braun P, Sinou C, Heughebaert A & Archambeau AS, Trans.). v1.0 Copenhague : Secrétariat GBIF. https://doi.org/10.35035/doc-vf1a-nr22. (Publié initialement 2021).

 

Lire l'article original

 

En préparation de la Quinzième Convention des Parties (COP15) à la Convention des Nations Unies sur la Diversité Biologique (CBD), l'Alliance pour la connaissance de la biodiversité organise une consultation communautaire. Avec l'aide de partenaires-clés à travers l'interface science-politique, la consultation engagera les personnes impliquées dans l'élaboration d'indicateurs mondiaux et nationaux au titre du cadre mondial de la biodiversité (GBF) post2020 (GBF) et des variables essentielles de la biodiversité (EBVs) de la CDB.

Pour commencer la discussion, nous encourageons les membres de la communauté à lire le livre blanc, Primary biodiversity data and the Post-2020 Global Biodiversity Framework (Données primaires sur la biodiversité et le Cadre mondial de la biodiversité post-2020), qui donne un aperçu de la dépendance des cadres d'indicateurs précédents et futurs sur les données primaires sur la biodiversité.

 

Regardez l'enregistrement du webinaire de lancement

L'ordre du jour du webinaire constituera la base d'une consultation modérée de deux semaines abordant les thèmes suivants :

 

La discussion explorera comment améliorer les flux de travail autour des données primaires sur la biodiversité sur lesquelles reposent les indicateurs et les EBV et soulignera le rôle clé des réseaux d'observation de la biodiversité et des installations d'information dans la réalisation des objectifs du GBF.
La discussion s'est poursuivie jusqu'au 28 septembre 2022 à 09h00 CEST UTC+2.

 

Plus de détails disponibles auprès de l'Alliance pour la connaissance de la biodiversité..

 

Lieu : Virtuel
Date : 13 septembre 2022 15:00 - 16:30 UTC +02:00
Langue : Anglais

 

Bonnet saignant (Mycena sanguinolenta), observé en Norvège. Photo © 2020 Kirsti Anne Mandal via le Service norvégien d'observation des espèces.

 

Lire l'article original

L'analyse des enregistrements dans les ensembles de données mis à jour détecte les erreurs potentielles, permettant aux gestionnaires de données de prendre des décisions opportunes sur la préservation des identifiants existants

 

Les améliorations apportées aux processus d'ingestion de données du GBIF permettront aux gestionnaires et aux producteurs de données de faire des choix plus judicieux et plus éclairés lorsque les mises à jour de leurs données modifient les identifiants uniques attribués à chaque enregistrement d'occurrence dans GBIF.org.

Les ID d'occurrence GBIF (gbifID) ne sont pas conçus comme des identifiants persistants. En fait, il s'agit simplement de la chaîne numérique utilisée pour former l'URL de toute occurre nce individuelle, par exemple 2284341217). Cependant, ces identificateurs fournissent souvent un moyen pratique et le meilleur disponible pour créer des références cohérentes et non ambiguës à ces enregistrements individuels.

Par conséquent, l'amélioration de leur stabilité peut aider les détenteurs de données et les chercheurs qui citent et relient des enregistrements de spécimens ou d'observations, alors même qu'ils attendent les résultats d'initiatives au sein de la communauté GBIF visant à développer un système mondial robuste d'identificateurs persistants uniques. (Cette problématique peut fournir une introduction aux détails techniques pour ceux qui souhaitent en savoir plus sur le sujet plus large.)

Avec l'introduction de ces améliorations back-end, lorsque les producteurs mettent à jour les ensembles de données, le pipeline de traitement des données analyse chaque mise à jour et alerte le service d'assistance du GBIF s'il détecte un nombre anormalement élevé d'identifiants modifiés. Le personnel peut ensuite examiner les données et travailler avec les producteurs de données pour confirmer si les modifications sont intentionnelles ou non. Le personnel du Secrétariat surveillera et affinera le seuil de déclenchement de ce processus au fil du temps.

Les producteurs de données modifient généralement les ID d'occurrence GBIF pour l'une des trois raisons suivantes :

  1. Mises à jour administratives reflétant les décisions politiques, telles que l'adoption de nouveaux identifiants (par exemple CETAF Stable Identifiers) ou de nouveaux modèles (par exemple institutionCode : collectionCode : catalogNumber), l'introduction du cryptage du site Web (par exemple http > https) ou des modifications du nom ou conditionnement des jeux de données.
  2. Erreurs involontaires causées par inadvertance dans les coulisses par des mises à jour logicielles, des scripts défectueux ou d'autres problèmes techniques.
  3. Manque de sensibilisation que l'introduction de modifications généralisées ou fréquentes des ID d'occurrence peut avoir des conséquences en aval pour les autres utilisateurs.

Dans le cas du premier exemple, le service d'assistance du GBIF dispose désormais d'un flux de travail permettant aux producteurs de données de coordonner les modifications administratives, de détecter les erreurs accidentelles et de préserver la provenance et la cohérence des enregistrements individuels sans créer de nouveaux identifiants d'occurrence.

 

« Le maintien de la stabilité des gbifID est essentiel pour renforcer la confiance dans la recherche et les systèmes dont elle dépend », a déclaré David Shorthouse, développeur de Bionomia, un environnement de conservation ouvert permettant de relier et de créditer les enregistrements de spécimens d'histoire naturelle aux experts qui ont collecté et identifié leur. « Toute amélioration de la durabilité et de la persistance des gbifID apporte plus de stabilité à Bionomia, plus de confiance dans les liens que nos bénévoles établissent et un plus grand potentiel pour effectuer des flux de travail aller-retour afin de réintégrer les améliorations numériques dans les systèmes de gestion des collections et d'autres magasins de données locaux. »

 

«Des identifiants d'occurrence stables sont une condition préalable pour faire correspondre les citations matérielles dans les publications aux occurrences et ainsi étendre l'accès et la connaissance d'une occurrence » a déclaré Donat Agosti, président du participant GBIF et producteur de données Plazi. « Ces correspondances constituent la première étape vers la révélation d'occurrences cachées dans les publications et la mise en relation des spécimens des collections d'histoire naturelle avec les traitements taxonomiques de leurs bibliothèques - un sujet brûlant actuellement soutenu par le projet BiCIKL financé par l'UE , les universités suisses et le Fond Arcadia. »

 

Avec ces changements en place, le GBIF va maintenant commencer à développer des outils qui surveillent la stabilité des identifiants d'occurrence par institution et par pays et aident les utilisateurs de données à évaluer si les identifiants répondent à leurs besoins.

 

Nymphe d'un papillon jaune des graminées à trois points (Eurema blanda subsp. arsakia), observée sur l'île de Taïwan. Photo 2022 via les données d'occurrence de la teigne de Taiwan collectées à partir du réseau social, sous licence CC BY 4.0.

 

Lire l'article original

6 octobre 2022 de 9h à 17h, Etterbeek, Belgique

 

 

 

L'événement sera diffusé en direct pour tous ceux qui souhaitent le suivre, mais a participation en personne est limitée aux participants et délégués invités à la 29e réunion du Conseil d'administration du GBIF ( inscrivez-vous ici), en raison de l'espace limité.

 

Contexte de la rencontre

Un symposium d'une journée organisé par le Partenariat européen pour la biodiversité (Biodiversa+) et le Système mondial d'information sur la biodiversité (GBIF), en marge de la 29e réunion du Conseil de direction du GBIF (GB29),, qui se tiendra à Bruxelles du 3 au 5 octobre. Biodiversa+, regroupant 74 acteurs des politiques de recherche et des acteurs des politiques environnementales de 36 pays européens et associés, fait partie de la Stratégie européenne pour la biodiversité à l'horizon 2030 qui vise à renforcer l'interface entre la science, la politique et la pratique. La co-organisation de ce symposium avec le GBIF offre un forum aux principales parties prenantes pour renforcer la coopération entre Biodiversa+, le GBIF, la Commission européenne, les agences, les programmes de recherche, les infrastructures, les réseaux et les initiatives afin de mettre en œuvre la stratégie 2030 de l'UE pour la biodiversité et la vision 2050 de « Vivre dans harmonie avec la nature » adoptée dans le cadre de la Convention sur la diversité biologique.

 

Objectifs généraux de la journée

  • Explorer et clarifier le paysage émergent dans les institutions basées dans l'UE afin de soutenir la fourniture d'informations fiables sur la biodiversité à l'appui de la prise de décision et de la recherche
  • Discuter et commencer à catalyser les collaborations nécessaires pour assurer la coordination à l'échelle nationale, régionale et mondiale afin de répondre aux besoins d'information sur la biodiversité sans duplication des efforts
  • Démontrer la pertinence des initiatives basées dans l'UE pour soutenir les activités et les objectifs mondiaux du GBIF

 

Structure de l'événement

La journée sera structurée en trois sessions, chacune abordant plusieurs perspectives sur un même thème à partir d'une série d'intervenants. La journée se terminera par la réunion de tous les orateurs pour une table ronde et un dialogue ouvert. Chaque orateur disposera de 12 à 15 minutes pour présenter, suivi de 5 minutes pour les questions.

 

Ordre du jour

9h00–10h30 Séance 1 - Mise en scène

  • Introduction et présentation des objectifs de la réunion
    Tim Hirsch, directeur adjoint GBIF
  • Remarques d'ouverture et de bienvenue présentées par la DG-ENV
    Anne Teller, chargée de mission senior, DG ENV
  • Présentation de la DG-INTPAA
    Thierry Dudermel, Partenariats internationaux Union européenne
  • Présentation du GBIF
    Joe Miller, secrétaire exécutif du GBIF
  • Présentation de Biodiversa+
    Hilde Eggermont, Biodiversa+ Président/Coordinateur – Belspo Belgium
    and Rob Hendriks, co-chef du groupe de travail Biodiversa+ – LNV Pays-Bas
  • Presentation from the GBIF network
    Anne-Sophie Archambeau, présidente du Comité des nœuds du GBIF, responsable des nœuds du GBIF France

 

11.00—12:30 Session 2 : Coordonner les réseaux de biodiversité pour la recherche et la politique scientifique à travers l'écosystème européen

  • Présentation d'EuropaBON
    Henrique Pereira, coordinateur scientifique
  • Présentation de l'Agence européenne pour l'environnement (AEE)
    Brian MacSharry, chef du groupe de la biodiversité
  • Présentation de l'ESFRI
  • Présentation du Centre de connaissances sur la biodiversité
    Camino Liquete, Commission européenne. Centre commun de recherche, Centre de connaissances de la CE sur la biodiversité>

 

13h30—15h00 Session 3 : Les données sur la biodiversité au service des besoins de développement mondiaux

  • Présentation sur le programme d'information sur la biodiversité pour le développement (BID)
    Maheva Bagard-Laursen, GBIFS et les bénéficiaires de BID
  • Présentation de l'Agence Française de Développement
    Julien Calas, chargé de recherche sénior biodiversité
  • Présentation de la DG Recherche et innovation
    Philippe Tulkens, chef d'unité, Climat et limites planétaires

 

15.30 – 17.00 Table ronde avec tous les présentateurs et discussion ouverte

 

The event will be livestreamed for anyone wishing to follow it, but in-person attendance is restricted to invited participants and delegates at the 29th meeting of the GBIF Governing Board (register here), due to limited space.

 

< Accès au direct >


Lieu : Centre de Conférences Albert Borschette, CCAB, Commission européenne
Emplacement : Rue Froissart 36, 1040 Etterbeek
Pays ou région : Belgique
Date : 6 octobre 2022 09:00 - 17:00 UTC +02:00
Langue : Anglais

 

Lire l'article original

Des éditeurs de données sélectionnés, des nœuds et des développeurs de systèmes de gestion des collections obtiendront de petits contrats pour participer à un projet pilote qui explorera et affinera l'affichage de données de spécimens plus riches

Date limite : 2 octobre 2022

Le secrétariat du GBIF sollicite des propositions d'éditeurs de données, de nœuds de participants et de développeurs de systèmes de gestion des collections pour participer à un projet pilote montrant comment un modèle de données unifié émergent peut améliorer la manière dont les données dérivées de spécimens dans des collections scientifiques sont représentées dans le GBIF. Les détenteurs et les gestionnaires de données de spécimens choisis pour participer au projet pilote contribueront à faire progresser la capacité du modèle de données à prendre en charge des applications scientifiques plus larges des données de spécimens à l'avenir et à permettre la découverte d'enregistrements de spécimens au sein du Registre mondial des collections scientifiques (GRSciColl).

Le GBIF développe un nouveau modèle de données en réponse aux commentaires de la communauté et aux recommandations de l' examen de vingt ans du GBIF de CODATA pour permettre la publication de types de données sur la biodiversité plus riches et plus complexes à l'avenir. L'initiative a adopté une approche d'étude de cas, en commençant par des récits développés par des groupes d'éditeurs de données qui rencontrent actuellement des difficultés pour partager leurs données via le GBIF. L'analyse de ces études de cas a conduit à l'émergence d'un modèle de données unifié unique qui vise à satisfaire les exigences détaillées dans une collection croissante d'études de cas.

Le succès de ce travail dépendra de l'engagement d'un large éventail de personnes qui publient des données sur la biodiversité. Les personnes sélectionnées pour tester et affiner davantage le modèle unifié dans le cadre de cet appel à propositions prépareront des ensembles de données qui illustrent les complexités que les éditeurs de spécimens de données souhaitent capturer et partager via le GBIF à l'avenir. La série de webinaires communautaires en cours du GBIF continuera d'explorer, étude de cas par étude de cas, comment le modèle unifié proposé peut prendre en charge la structuration et la publication des données.

Le webinaire de juillet s'est concentré sur les systèmes de gestion des collections, utilisant des exemples de données d'Arctos pour démontrerune preuve de concept pour le modèle de données, tandis que d'autres membres du réseau GBIF qui travaillent avec des données relatives aux collections physiques et aux spécimens ont été invités à préparer des interventions et à offrir des commentaires. Ces contributions contribueront toutes au déploiement d'un catalogue de matériel qui explore des aspects plus riches des données de spécimens qui vont au-delà de la simple preuve spatio-temporelle physique des taxons actuellement détectables dans les occurrences basées sur des spécimens sur GBIF.org .

Un comité de sélection examinera les candidatures dont les résultats seront communiqués avant la fin octobre 2022. Les travaux sur le projet pilote commenceront en novembre 2022.

Portée du projet pilote

Les candidats sélectionnés dans le cadre de cet appel à propositions travailleront avec le Secrétariat pour remplir une base de données pilote utilisée pour démontrer un catalogue de spécimens en ligne interrogeable. L'objectif est de représenter fidèlement ces données à partir de leur source dans un environnement agrégé qui prend en charge une recherche et une enquête scientifiques plus larges que ce qui est actuellement possible. Le résultat du projet pilote présentera les données des candidats sélectionnés sur des pages modèles (Voir l'exemple).

Les candidats retenus devront accomplir les tâches suivantes sur une période d'environ six à huit semaines :

  1. Fournir un ou plusieurs ensembles de données reformatés dans le modèle de données unifié émergent sous forme de fichiers CSV adaptés à la base de données pilote
  2. Participer à des appels de groupe avec d'autres participants
  3. Fournir des commentaires et des suggestions sur l'affichage des données sur les pages de démonstration du catalogue de matériaux, y compris des sujets tels que :
    1. Comment les informations doivent être structurées et affichées
    2. Comment GBIF devrait appliquer des enrichissements, tels que des taxons supérieurs ou des informations géographiques, et les liens déduits vers d'autres éléments via nos algorithmes de clustering
    3. Comment le spécimen doit être cité, par exemple, en tant que matériel examiné dans un article
    4. Quels identifiants doivent être utilisés pour faire référence au spécimen et à la page du spécimen compilé (y compris éventuellement les DOI émis via le GBIF)
    5. Comment les annotations doivent être affichées, par exemple les drapeaux automatiques du traitement, l'utilisation future des annotations générées par la communauté
  4. Enregistrez une présentation et assistez à un webinaire communautaire pour partager et présenter vos propres données dans les résultats

 

Financement disponible et éligibilité pour postuler

Les candidats peuvent demander jusqu'à 3 000 € maximum pour soutenir leur participation à ce projet pilote sous la forme d'un petit contrat. Nous accueillons également les candidatures de groupes souhaitant autofinancer leur participation à ce projet pilote.

Les candidatures sont les bienvenues de la part des représentants, y compris du personnel ou des entrepreneurs individuels/indépendants de :

  • Institutions situées dans un pays participant au GBIF (voir liste des pays participants votants et associés)
  • Fournisseurs de systèmes de gestion des collections utilisés par les institutions dans les pays participant au GBIF
  • Nœuds participants GBIF ayant une expérience de la mise en forme des données de collecte et qui ont accès aux données de collecte à utiliser dans ce projet pilote
  • Partenariats entre l'un des éléments ci-dessus

Dans tous les cas, les candidats doivent démontrer dans leur proposition qu'ils sont autorisés à utiliser les données avec lesquelles ils ont l'intention de travailler au cours de ce projet pilote.

Tous les candidats doivent remplir l'un des critères suivants :

a) publier activement des données via le GBIF
b) s'engager à publier de nouveaux ensembles de données via le GBIF à la suite de ce travail
c) développer ou soutenir activement un système de gestion des collections et disposer d'un ensemble de données qui peut se conformer au critère a ou b

Les candidats doivent avoir de l'expérience et des connaissances dans les domaines suivants :

  • Pratiques actuelles de publication des données du GBIF
  • Structure des données qu'ils utiliseront dans le travail pilote
  • Familiarité avec les objectifs du projet de diversification du modèle de données GBIF
  • Compétence technique suffisante pour être en mesure de comprendre le modèle de données unifié et de fournir un ou plusieurs ensembles de données à l'aide de ce modèle. Un support technique sur le modèle unifié sera disponible pendant la durée du contrat, mais les candidats doivent être familiarisés avec les bases de l'utilisation d'une base de données telle que PostgreSQL, les schémas, les contraintes et les clés étrangères.

 

Processus et critères de sélection

Les candidatures seront évaluées par un comité de sélection, convoqué par le Secrétariat du GBIF, comprenant des experts externes, en utilisant les critères suivants :

  • Historique de la publication régulière de données avec le GBIF et mise à jour des jeux de données publiés
  • Maintenance des entrées GRSciColl associées
  • Volume de données actuellement publiées dans le GBIF qui serait affecté, ou potentiel de combler les lacunes connues dans les données à l'avenir, à la suite de ce travail
  • Expérience antérieure démontrée dans la publication de données plus complexes via GBIF (en ABCD ou en utilisant les extensions DwC-A)
  • Étendue de l'ébauche du modèle de données qui sera couverte dans les données fournies pour ce projet pilote, par exemple (mais sans s'y limiter) :
    • Mesures
    • Media
    • Identifications liées à l'ADN
    • Plusieurs taxons dans les identifications
    • Spécimens complexes
    • Préparations de matériel
    • Relations inter-échantillons
    • Occurrences multiples d'individus biologiques spécifiques
    • Liens entre collections
  • Potentiel de réutilisation de la solution par d'autres éditeurs ; par exemple, des scripts réutilisables ou des améliorations à un outil que de nombreuses personnes utilisent
  • Potentiel du projet pour accroître la diversité des collections couvertes par le projet de modèle de données GBIF et les régions géographiques des contributeurs
  • Justification claire des coûts prévus associés à ce travail

 

Processus de demande

Les candidats doivent soumettre leurs propositions en anglais par e-mail avant le dimanche 2 octobre 2022.

Pour toutes les candidatures, veuillez préciser que le ou les dépositaires de données concernés soutiennent la candidature. Fournir des lettres de soutien si nécessaire.

Les candidats doivent fournir un document de proposition (deux pages maximum) comprenant :

  • La personne de contact principale pour la candidature
  • La personne ou l'institution qui recevra le contrat
  • Tout autre partenaire qui serait impliqué dans les travaux du projet pilote soutenus par le contrat
  • Une description de :
    • Quels ensembles de données vous - ou vos partenaires - publiez actuellement des données via GBIF et quels défis avez-vous rencontrés pour adapter les données au modèle de données actuel ?
    • Quel(s) ensemble(s) de données utiliseriez-vous dans ce projet pilote et quels domaines du nouveau modèle de données les données couvrent-elles ?
    • Quels enregistrements GRSciColl se rapportent à l'application ?
    • Comment le travail que vous entreprenez dans ce projet pilote pourrait-il être réutilisé par d'autres ?
    • Comment le financement que vous demandez serait-il utilisé pour soutenir ce travail et prévoyez-vous d'apporter d'autres ressources en nature ?

Un comité de sélection examinera les candidatures dont les résultats seront communiqués avant la fin octobre 2022. Les travaux sur le projet pilote commenceront en novembre 2022.

Veuillez noter que les candidats retenus devront signer un contrat de service pour ce travail. Le paiement en euros suivra la réussite des tâches et un rapport narratif final..

 

Lire l'article original

Revenir en haut