The “datashed” concept, in which data is generated by producers and, through processes of uploading and sharing, can become aggregated with other data “streams.” (1) Data never leaves the instrument of collection; (2) data that are held tightly by the producer; (3) highly fragmented datasets; (4) local data sets that are shared only within the institutional body; (5) smaller data pools that may eventually pool together as part of larger projects involving multiple groups; (6) data dams, created by firewalls, paywalls, or layers of menus; (7) ended projects with their stagnated data; (8) data in unusable forms; (9) disassociation of data sets from their original producers; and (10) disciplinary mountains that separate datasheds. (ICES Journal of Marine Science)

Disrupting data sharing for a healthier ocean

Le partage des données océanographiques est un des enjeux majeurs pour la préservation de l’océan, mais comment devrions-nous nous y prendre face à la multitude des données et à l’accès souvent difficile à ces données? Des pistes sont données dans cette publication disponible en Open Acces et menée par Linwood Pendleton.

Résumé: Ocean ecosystems are in decline, yet we also have more ocean data, and more data portals, than ever before. To make effective decisions regarding ocean management, especially in the face of global environmental change, we need to make the best use possible of these data. Yet many data are not shared, are hard to find, and cannot be effectively accessed. We identify three classes of challenges to data sharing and use: uploading, aggregating, and navigating. While tremendous advances have occurred to improve ocean data operability and transparency, the effect has been largely incremental. We propose a suite of both technical and cultural solutions to overcome these challenges including the use of natural language processing, automatic data translation, ledger-based data identifiers, digital community currencies, data impact factors, and social networks as ways of breaking through these barriers. One way to harness these solutions could be a combinatorial machine that embodies both technological and social networking solutions to aggregate ocean data and to allow researchers to discover, navigate, and download data as well as to connect researchers and data users while providing an open-sourced backend for new data tools.

Les écosystèmes océaniques sont en déclin, mais nous avons aussi plus de données océaniques et de portails de données que jamais auparavant. Pour prendre des décisions efficaces en matière de gestion des océans, en particulier face aux changements environnementaux mondiaux, nous devons tirer le meilleur parti possible de ces données. Pourtant, de nombreuses données ne sont pas partagées, sont difficiles à trouver et ne sont pas accessibles de manière efficace. Nous identifions trois catégories de défis au partage et à l’utilisation des données : le téléchargement, l’agrégation et la navigation. Bien que des progrès considérables aient été réalisés pour améliorer l’opérabilité et la transparence des données océanographiques, l’effet a été largement incrémentiel. Nous proposons un ensemble de solutions techniques et culturelles pour surmonter ces défis, y compris l’utilisation du traitement du langage naturel, la traduction automatique des données, les identificateurs de données basés dans des registres, les devises numériques communautaires, les facteurs liés aux données et les réseaux sociaux pour franchir ces obstacles. Une façon d’exploiter ces solutions pourrait être une machine combinatoire qui comprendrait des solutions technologiques et de réseautage social pour agréger les données océanographiques et permettre aux chercheurs de découvrir, de naviguer et de télécharger des données, ainsi que de relier les chercheurs et les utilisateurs de données tout en fournissant une source ouverte pour de nouveaux outils de données. (Traduit avec www.DeepL.com/Translator).

Linwood H Pendleton, Hawthorne Beyer, Estradivari, Susan O Grose, Ove Hoegh-Guldberg, Denis B Karcher, Emma Kennedy, Lyndon Llewellyn, Cecile Nys, Aurélie Shapiro, Rahul Jain, Katarzyna Kuc, Terry Leatherland, Kira O’Hainnin, Guillermo Olmedo, Lynette Seow, Mick Tarsel, Disrupting data sharing for a healthier ocean, ICES Journal of Marine Science, , fsz068, https://doi.org/10.1093/icesjms/fsz068