- Web de données et création de valeurs : le champ des possibles - Gérald Kembellec, Camille Prime-Claverie p. 28-29
En 1991, le projet WorldWideWeb était rendu public dans un message Usenet et faisait ses premiers pas en dehors de l'Europe avec l'installation d'un serveur en Californie. Vingt-cinq ans et trois versions du Web plus tard, ce réseau est devenu un maillon essentiel de notre société : conçu selon un modèle statique, il est devenu social au début des années 2000 et se veut en passe de devenir sémantique. Mais que signifie exactement cette progression ? De nouveaux modèles documentaires sont-ils en train de se développer ? En tant que professionnels de la documentation, nous nous interrogeons dans ce dossier sur la place prise par les données et les métadonnées sur le Web. Nous verrons en quoi leur liaison et leur interopérabilité peuvent aboutir à la création de la valeur.
The web of data and creation of value: the range of possibilities
In 1991, the World Wide Web project was made public in a Usenet message and with the installation of a server in California, took its first steps outside Europe. 25 years and three versions of the Web later, this network has become an essential element of our society. Initially designed as a static model, it became social at the start of the new millenium and is becoming semantic. But what does this evolution really mean? Are new information models emerging? As information professionals, we examine the place taken by data and metadata on the Web, and describe how their linkage and networking can take us to value creation.
- Le web de données en contexte bibliothécaire - Gérald Kembellec p. 30-31
[repères] La question du web de données a été un enjeu fort ces dernières années dans le monde de l'information-documentation ; c'est même devenu une problématique d'innovation majeure dans les centres de documentation et les bibliothèques. Après avoir parlé pendant longtemps de « silos de données » pour les catalogues électroniques des bibliothèques, la notion de liaison des « données structurées » est introduite dans le vocabulaire de l'architecte des systèmes d'information en bibliothéconomie. L'optique de cette volonté d'interopérabilité des données et métadonnées est de constituer un réseau global d'informations décrites selon des vocabulaires communs. Ce premier pôle interroge les enjeux, modèles et méthodes réels induits par ce changement et propose des exemples concrets de projets existants.
The Web of Data in the context of libraries
Over the last few years the Web of Data has presented a major challenge to the information profession, with an impact on major innovations in information centers and libraries. Following lengthy discussion about "data silos" pour electronic library catalogs, the notion of linking "structured data" was introduced in the vocabulary of information and library science system architects. The aim of data and metadata interoperability is to build a global information network using common vocabularies. The first section of our dossier explores the challenges, models and actual methods brought to the fore by this change and presents some concrete examples of ongoing projects.
- Comprendre les standards du web de données - Bruno Menon p. 32-34
[contexte] Pour publier sur le Web des données accessibles, exploitables, combinables entre elles et interprétables, il faut les exprimer et les décrire dans des formats et des modèles homogènes, stables, explicites et consensuels : bref, il faut se conformer aux standards – ou « langages » – élaborés par le World Wide Web Consortium. L'architecture dessinée par ces standards peut apparaître complexe au premier abord, mais il importe d'en saisir la cohérence. En voici une vue d'ensemble.
- De la SDN à la Nuit debout : Les métadonnées et les enjeux de gouvernance internationale - Vincent Boulet p. 35-36
[évolution] Le système de gouvernance des métadonnées passe d'un fonctionnement vertical à un modèle davantage déconcentré et horizontal. Les acteurs sont plus divers. L'enjeu essentiel est de concilier leurs besoins et intérêts, par définition divers, avec une mise en cohérence de la structuration des données pour pourvoir les partager librement et de plus en plus automatiquement.
- Web de données et bibliothèques : l'évolution du modèle d'agrégation des données - Emmanuelle Bermès p. 37
[action] Les enjeux du web de données ont incité les bibliothèques à faire preuve d'initiative, notamment en créant des portails orientés « entités ». Aujourd'hui, elles vont plus loin en favorisant la production de données collaboratives.
- Démarche et usage de données liées pour le registre ReLIRE - Benjamin Duhamel p. 38-39
[méthode] Des compétences métier techniques et conceptuelles sont indispensables pour comprendre, modéliser et mettre en œuvre un projet documentaire utilisant les principes du web de données. L'exemple du dispositif ReLIRE illustre ici les méthodes de regroupement et d'utilisation de données liées.
- Des APIs Istex et Base pour les bibliothèques d'enseignement supérieur de Saint-Étienne - Caroline Bruley, David Varenne p. 40-41
[illustration] Le catalogue Brise ES + est un exemple d'enrichissement notable de l'Opac par l'ajout de webservices permettant d'interroger directement des bases de référence pour la recherche.
- Linked science et web de données - Camille Prime-Claverie p. 42-43
[perspectives] Dans le contexte du web sémantique, l'un des enjeux majeurs consiste à relier l'ensemble des connaissances culturelles et scientifiques participant ainsi au développement du Linked Open Data. Plus particulièrement, dans l'univers scientifique, la linked science est une approche visant l'interconnexion des différents objets scientifiques comme, par exemple, les publications de recherche, les données scientifiques ou les institutions de recherche, afin de rendre la recherche transparente, reproductible et interdisciplinaire.
Linked science and Web of Data
In the context of the semantic web, one of the major challenges is linking all cultural and scientific knowledge as they participate in the development of Linked Open Data. In particular, in the sciences "linked science" is an approach that aims to interconnect different scientific objects such as research publications, scientific data or research institutions, making research transparent, reproducible and interdisciplinary.
- Isidore Suggestion, des recommandations de lecture pour les blogs de science - Stéphane Pouyllau p. 44
[ressource] Le web sémantique et l'ouverture des données dans les SHS ont favorisé la création d'outils de recherche nouveaux se traduisant à la fois par la création de portails documentaires et d'applications pouvant être embarquées dans des sites web. Isidore, l'accès unifié aux données, publications et informations des SHS, entre dans cette catégorie.
- Des textes augmentés avec les données du Web - Thomas Francart p. 45
[zoom] Les contenus textuels peuvent bénéficier de méthodes d'enrichissement dans les hypertextes depuis des bases de connaissances sémantisées. Retour d'expérience.
- Le développement du web des données culturelles : Les enjeux pour le ministère de la Culture et de la Communication - Bertrand Sajus, Marie-Véronique Leroi p. 46-47
[expertise] Dès les années 1990, le ministère de la Culture et de la Communication a promu l'intégration et la diffusion des bases de données culturelles dans l'écosystème du Web. D'où l'importance qu'il accorde à l'interopérabilité et à l'interconnexion des données. Cet article présente les actions et projets ministériels dans le champ du web sémantique et du web des données liées.
- L'enjeu du web de données pour les éditeurs - Jean-Paul Jorda p. 48
[métier] L'éditeur EDP Sciences, propriété de sociétés savantes, publie une cinquantaine de revues internationales de recherche dans divers domaines scientifiques. C'est un acteur du « web des sciences » engagé depuis plus de 20 ans dans la révolution numérique.
- L'enjeu du web de données pour l'édition scientifique - Lise Verlaet, Hans Dillaerts p. 49
[impact] Cet article présente le concept d'éditorialisation sémantique et explicite les opportunités de l'enrichissement sémantique des publications scientifiques pour l'ensemble des acteurs de l'IST (auteurs, éditeurs et professionnels de l'information).
- DBpédia.fr : retour sur la publication de données de la culture française - Fabien Gandon, Raphaël Boyer, Alexandre Monnin p. 50-51
[enjeu] Les projets DBpédia et Semanticpédia illustrent la possibilité de réutilisation des données dans de nombreuses applications grâce à des langages et à des schémas de descriptions qui sont ici expliqués.
- Re-Source, une archive en temps réel pour la publication et la production - Alexandre Monnin, Jérôme Denis, Nicolas Delaforge p. 52-53
[initiative] Lafayette Anticipation est une fondation d'art contemporain qui met l'accent sur la production et l'accompagnement des artistes. Le projet Lafayette Re-Source, une archive sémantique en temps réel, a pour vocation de permettre le suivi de l'ensemble des activités qui contribuent à donner naissance à une œuvre. Il entend ainsi faciliter la compréhension du travail réalisé par la fondation en interne, donner au public des prises pour apprécier les œuvres dans leur déploiement (l'art en train de se faire et non l'art déjà fait) et livrer du même coup aux artistes un nouveau matériau pour la création.
- Du web sémantique au web des données, quels enjeux professionnels ? - Jean Charlet, Gérald Kembellec p. 54-55
[application] Si quelques industriels se sont approprié le web de données dès ses prémices, principalement en recherche et développement, ses implications concrètes restent peu connues du grand public, ce qui ne signifie pas qu'il n'y ait pas d'impact tangible. En effet, les utilisations des principes du web de données sont présentes dans plusieurs aspects de l'Internet d'aujourd'hui, à commencer par leur prise en compte dans les récentes évolutions de l'algorithme du leader des moteurs de recherche.
From the semantic web to the Web of Data, what are the issues for professionals?
Several industrial sectors have been using the Web of Data from its inception, primarily in research and development. Although their concrete implications are little known to the general public, they have had a tangible impact. The principles of the Web of Data are used in many aspects of the Internet today, starting with their integration in recent changes to the algorithme used by the industry leader in search engines.
- Données liées et documentation médicale - Jean Charlet p. 56-58
[observation] La médecine est un des domaines où les données liées semblent pleines de promesses dans l'optique de mieux soigner les patients, de mieux accompagner le « bien-être », voire de découvrir de nouvelles connaissances médicales. Il faut pourtant faire attention à la qualité de ces données et aux modèles qui les sous-tendent, au risque d'être incapable de répondre aux espoirs mis dans ces technologies.
- OntoToxNuc : recherche d'information et enjeux pour la collaboration et la valorisation - Anne-Claire Le Picard p. 59
[travaux] Dans le cadre du programme ToxNuc, piloté par la direction des sciences du vivant du CEA, une ontologie, OntoToxNuc, a été créée. Elle répondait au besoin d'une sémantique commune dans les plate-formes collaboratives du programme. En 2014, ce référentiel, déjà conforme au standard d'interopérabilité RDF, est envisagé à l'échelle du Linked Open Data (LOD).
- Enrichissement d'une base documentaire pour un système de recommandation dans le tourisme - Hacène Cherfi, Ghislain Atemezing, Florence Amardeilh, François Rouzé p. 60-62
[pratique] Cet article présente un moteur qui permet de recommander des « expériences à vivre » dans le domaine du tourisme en s'appuyant sur les inspirations de l'utilisateur. Le moteur compare ces inspirations aux expériences à vivre décrites dans une base de connaissances. Le système analyse des contraintes parfois complexes liées aux caractéristiques des destinations et aux souhaits de l'utilisateur afin de lui proposer la destination associée à l'expérience à vivre la plus pertinente.
- Écrire avec une machine à calculer, écrire pour une machine à calculer - Stéphane Crozat p. 62-64
[orientation] Les chaînes éditoriales ont opéré une transformation de l'acte d'écriture en rendant le calcul accessible aux auteurs. Avec le web des données, elles doivent à présent se préoccuper de rendre accessibles le contenu aux machines.
- Que voit réellement Google de la sémantique des pages web ? - Gérald Kembellec p. 65
[focus] Avec Google Panda, Penguin et Hummingbird, dernières évolutions de l'algorithme de Google ces dernières années, la qualité des données et métadonnées devient un argument important pour l'optimisation de référencement naturel des pages web.
- ELI : une « mise en lien » des textes juridiques européens - Thomas Francart, Jean Delahousse p. 66-67
[approche] À l'initiative des Journaux officiels européens, un web de données juridiques nommé ELI (European Legislation Identifier) a vu le jour en 2015. Déjà adopté par quelques États précurseurs, il est déployé actuellement par d'autres États membres, sur la base du volontariat.
- Sources & ressources - Adriana Lopez-Uroz p. 68-69
