Skip to content

Latest commit

 

History

History
125 lines (75 loc) · 15.4 KB

nLinkedData.md

File metadata and controls

125 lines (75 loc) · 15.4 KB

Publier ses données sous forme de données liées

En Europe, les données de recherche des programmes financés doivent désormais faire l’objet d’une publication ouverte. Il faudra probablement du temps avant qu’une telle obligation soit mise en œuvre par la plupart des projets de recherche. Une telle obligation n’existait pas encore au Canada jusqu’à la publication, en 2016, de la Déclaration de principe des trois organismes subventionnaires sur la gestion des données numériques. Une ébauche de politique fait actuellement l’objet d’une consultation, sans offrir pour le moment un cadre opposable, elle oriente fortement les projets de recherche et rejoint la politique déjà adoptée en 2010 sur le libre accès aux publications.

Quoiqu’il en soit du caractère impératif de ces politiques, il est intéressant pour les chercheurs de réfléchir à des solutions d’exposition des données et des filières de publication en amont, au moment de la production des données de recherche. D’autant qu’une telle approche présente l’intérêt de permettre la réutilisation des données de recherche dans des contextes plus larges. Par exemple, en direction du grand public en ménageant des mécanismes automatiques d’alimentation de Wikidata, la méta-base de données des projets Wikipédia.

Dans une telle perspective, les technologies du web sémantique et des données liées, nous paraissent particulièrement intéressantes. Telle qu’elle a été promue par Tim Berners Lee, l’idée de données liées désigne un ensemble de principes concernant la mise à disposition de données brutes sur le web, en les rendant adressables et liables, de manière à ce qu’elles puissent être facilement découvertes, consultées, connectées et réutilisées. L’idée étant que les données issues d’institutions et d’organisations différentes puissent contribuer à un espace de données commun et partagé sur le web appelé le _ web de données_. Ces technologies nous paraissent particulièrement adaptées dans un contexte universitaire, car elles reposent sur l’utilisation d’ontologies et de vocabulaires qui autorise une grande richesse d’expression. Elles permettent donc publier de l’information scientifique de grande qualité tout en ménageant des dégradations éventuelles à l’aide de mappings.

Une telle logique n’est pas très éloignée des déclarations en faveur de l’Open Science. En effet, rendre disponibles ses données de recherche, c’est participer à l’accroissement mondial de la connaissance dans la continuité des principes promus par les déclarations en faveur de l’accès libre. Outre les réemplois possibles d’informations produites avec des financement public en vue d’autres utilisations, cette logique permet d’assurer la vérification des résultats de recherche et de s’inscrire dans des logiques vertueuses de production de connaissances.

À titre personne, je suis particulièrement favorable à une politique d’ouverture maximale. D’une part, parce que cela permet de se placer d’emblée dans un écosystème numérique qui repose principalement aujourd’hui sur les données ouvertes et liées. D’autre part, parce que cela permet de rentabiliser immédiatement l’investissement que nous devrons forcément faire en matière de structuration des données en vue de leur mise à disposition pour pouvoir enrichir nos contenus à partir du Linked Open Data. Enfin, parce que cette logique se trouve le plus souvent cohérente avec la plupart des projets de recherche auxquels je participe qui tirent parti ou sont relatifs à l’ouverture des données patrimoniales et culturelles et leurs nouveaux usages.

Quelques initiatives d’intérêt dans le monde de la recherche

Linked Research

Linked Research is an initiative, a movement, and a manifesto. We believe that scholarly communication is stunted by current scholarly and scientific practices, and we aim to promote change for the greater good. This is not something hypothetical or a dream for the future, it is completely possible with today's technologies based on native Web design principles and standards. A cultural shift is needed, and Linked Research is here to bring together like-minded people who want to push this forwards.

Linked Research est à la fois une initiative, un mouvement et un manifeste initié en 2017 pour promouvoir des changements profonds dans les pratiques de recherche. L’initiative repose notamment sur plusieurs appels auxquels il est possible de contribuer sous la forme de retours d’expérience et elle organise diverses rencontres à l’occasion de diverses manifestations scientifiques.

@url https://linkedresearch.org

Foundations for Open Scholarship Strategy Development

The purpose of this document is to provide a concise analysis of where the global Open Scholarship movement currently stands: what the common threads and strengths are, where the greatest opportunities and challenges lie, and how we can more effectively work together as a global community to recognise the top strategic priorities. This document was inspired by the Foundations for OER Strategy Development and work in the FORCE11 Scholarly Commons Working Group, and developed by an open contribution working group.

@url https://open-scholarship-strategy.github.io/site/

FORCE11

@url https://www.force11.org/group/scholarly-commons-working-group

Scholarly Commons

The scholarly commons is an agreement among researchers and other stakeholders in scholarly communication to make research open and participatory for anyone, anywhere. It is not another sharing platform, but a set of principles, concrete guidance to practice, and actions towards inclusivity of diverse perspectives from around the globe. Though a Force11 initiative, the scholarly commons is owned by no one, to be realized, used and contributed to by all.

Les Scholarly Commons sont le résultat d’un programme coordonné par Force11 à travers son groupe de travail dédié créé en octobre 2015.

@url https://scholarlycommons.org

Vivo

VIVO is an open source semantic web tool for research discovery -- finding people and the research they do.

VIVO supports editing, searching, browsing and visualizing research activity in order to discover people, programs, facilities, funding, scholarly works and events. VIVO's search returns results faceted by type for rapid retrieval of desired information across disciplines.

@url http://vivoweb.org

Linked Universities

Linked Universities is an alliance of european universities engaged into exposing their public data as linked data. Linked data is a set of principles to put raw data on the Web, making them Web addressable and linkable, so that they can be easily accessed, discovered, connected and reused. The idea is that data from different institutions and organisations can contribute to a common data space on the Web: the Web of Data.

Linked Universities était une alliance européenne d’universités engagées dans l’exposition de leurs données sous forme de données liées. Lancée en 2011, l’initiative s’est arrêtée en 2017.

@url https://web.archive.org/web/*/http://linkeduniversities.org

Digital Curation Centre (DCC)

Le Digital Curation Centre (DCC) est un centre d’expertise reconnu à l’échelle internationale dans l’administration de l’information numérique, axé sur l’établissement des capacités et des compétences pour la gestion des données de recherche. Le DCC offre des conseils d’expert et de l’aide pratique aux organismes de recherche souhaitant stocker, gérer, protéger et partager des données de recherche numérisées.

@url http://www.dcc.ac.uk/

Remarques sur le contexte de recherche Canadien

Les trois grands organismes subventionnaires de la recherche au Canada ont énoncé en 2016, une Déclaration de principes des trois organismes sur la gestion des données numériques. Ceux-ci considèrent que les bases de données et les données constituées ou rassemblées dans le cadre d’une recherche grâce au financement du gouvernement fédéral appartiennent au domaine public. En effet, ces données ne sont pas soumises au droit d’auteur (absence du critère d’originalité) et sont soumises au droit des bases de données (droit sui generis) qui implique une propriété relative aux moyens investis pour produire ces données.

Dès lors : « Toutes les données de recherche rassemblées grâce au financement du CRSH doivent être conservées et mises à la disposition des autres chercheurs dans des délais raisonnables, soit au cours des deux années suivant la fin du projet de recherche pour lequel les données ont été rassemblées. » Une telle politique implique qu’a minima, au terme du projet de recherche, les données deviennent accessibles par le public et leur mises à disposition pour des réutilisations éventuelles sous licences libres. Cela suppose également un certain investissement en matière de structuration des données comme le recours à des modèles partagés ou bien documentés, l’utilisation de formats appropriés et le déploiement de solutions techniques pour rendre ces données disponibles et les signaler sur le web.

Cette déclaration commune applique et prolonge la Politique sur l’archivage des données de recherche du CRSH datant de 1990 ainsi que les dispositions qui figuraient, depuis 2015, dans la Politique des trois organismes sur le libre accès aux publications. Plus généralement, celle-ci s’inscrit dans le contexte du mouvement pour les données ouvertes. Partout dans le monde, les gouvernements et les bailleurs de fonds de recherche développent des politiques pour faciliter la mise en valeur et la réutilisation des données numériques. Le Canada, comme de nombreux autres pays apporte son appui à la Déclaration sur l’accès aux données de la recherche financée par des fonds publics publiée par l’OCDE en 2004. Cet engagement a été confirmé par la Déclaration de gouvernement ouvert de 2011 et l’approbation de la Déclaration des ministres des Sciences du G8 de 2013. Cette politique concernant l’accès aux résultats de la recherche financée par le gouvernement fédéral figure également au Plan d’action du Canada pour un gouvernement ouvert de 2014.

Réseau Portage

Lancé en 2015 par l’Association des bibliothèques de recherche du Canada, le Réseau Portage coordonne l’expertise dans le domaine de la gestion des données de recherche. Le réseau cherche à développer une culture de gestion des données de recherche, à établir une communauté de pratiques et à favoriser la création de services et d’infrastructures destinés à la gestion des données de recherche à l’échelle nationale.

@url https://portagenetwork.ca/fr/

Canadian Linked Data Initiative

Canadian Linked Data Initiative est une initiative destinées à favoriser la collaboration entre les services techniques des principales bibliothèques de recherche canadiennes, conjointement avec les Archives nationales du Québec.

@url https://connect.library.utoronto.ca/display/U5LD/Canadian+Linked+Data+Initiative+Home

Données de Recherche Canada (DRC)

Naissance de DRC à la fin de 2011, soutien de CANARIE en 2015.

Vision : Faire en sorte que les Canadiens aient accès aux jeux de données nationaux et internationaux financés par les deniers publics. Mission : Avec le concours de ses intervenants, veiller à ce que les données scientifiques engendrent des innovations dont profitera chaque Canadien.

Stratégie :

  • Faciliter le développement de services de données nationaux intégrés qui aideront les chercheurs à tous les stades de leurs travaux et qui favoriseront une certaine harmonisation
  • Miser sur les activités habilitantes – mieux aligner les parties prenantes, promouvoir la réutilisation des données, combler les lacunes des technologies utiles
  • Liaison avec les organismes et les projets en GDR

cf. https://www.rdc-drc.ca/?wpdmdl=1448

Données de Recherche Canada (DRC)

https://www.rdc-drc.ca

Divers

  • Numéro spécial du Semantic Web Journal sur les données scientifiques liées
  • rOpenScience
  • Science on GitHub
  • Run my code
  • Assante, Massimiliano, Leonardo Candela, Donatella Castelli, Paolo Manghi, and Pasquale Pagano. "Science 2.0 Repositories: Time for a Change in Scholarly Communication."* D-Lib Magazine *21, no. 1/2 (2015). http://www.dlib.org/dlib/january15/assante/01assante.html
    • Sateli, Bahar, and René Witte. "Semantic Representation of Scientific Literature: Bringing Claims, Contributions and Named Entities Onto the Linked Open Data Cloud."* PeerJ Computer Science *1 (2015): doi:10.7717/peerj-cs.37.
  • Golden, Patrick, and Ryan Shaw. "Nanopublication Beyond the Sciences: The PeriodO Period Gazetteer."* PeerJ Computer Science *2 (2016): doi:10.7717/peerj-cs.44.
  • Groth, Paul, Andrew Gibson, and Johannes Velterop. "The Anatomy of a Nano-publication. Url: Http://www. W3. Org/wiki/images/c/c0." In HCLSIG SWANSIOC Actions RhetoricalStructure Meetings 20100215 Cwa-anatomy-nanopub-v3. Pdf (besucht Am 18. 07. 2013). 2010.
  • Kuhn, Tobias, Christine Chichester, Michael Krauthammer, Núria Queralt-Rosinach, Ruben Verborgh, George Giannakopoulos, Axel-Cyrille Ngonga Ngomo, Raffaele Viglianti, and Michel Dumontier. "Decentralized Provenance-aware Publishing with Nanopublications."* PeerJ Computer Science *2 (2016): doi:10.7717/peerj-cs.78.
  • @todo http://jsonld.com
  • Open Science Framework

Standards et bonnes pratiques

https://www.w3.org/TR/ld-bp/