Contenu du sommaire : Web de données et création de valeurs : le champ des possibles

Revue I2D - Information, données & documents (anciennement : Documentaliste - Sciences de l'information) Mir@bel
Titre à cette date : i2D : information, données et documents : pratiques & recherche
Numéro vol. 53, no 2, juin 2016
Titre du numéro Web de données et création de valeurs : le champ des possibles
Texte intégral en ligne Accessible sur l'internet
  • Opportunités... - Michèle Battisti p. 1 accès libre
  • Métiers et compétences

    • Professionnels de l'information et humanités numériques : compétences, formation, métier - Catherine Muller p. 4-6 accès libre avec résumé
      [opportunité] La journée annuelle de la Fulbi, « Humains numériques sans le savoir ? L'apport des professionnels des bibliothèques, de l'info-doc et du patrimoine aux digital humanities », était organisée en janvier dernier par le Cnam-INTD. La rencontre concernait chercheurs en sciences de l'information, archivistes, documentalistes, bibliothécaires et responsables de formation, tous mobilisés autour de la question, curieusement encore assez peu formulée par les professionnels eux-mêmes, de leur apport aux digital humanities.
    • Transformation numérique des entreprises : impact sur les métiers et formations des professionnels de l'information - Véronique Salaün p. 7-8 accès libre avec résumé
      [perspectives] La place des professionnels de l'information dans la transformation numérique et le rôle des signaux faibles dans le processus de veille furent abordés par l'ADBS, lors du Salon I-Expo 2016. Des conférences parallèles donnent aussi des réponses sur l'avenir des métiers de l'information et les outils numériques utiles à leurs entreprises.
    • Métiers de la donnée et de la visualisation : pourquoi un canevas ? - Claude Aschenbrenner p. 9-10 accès libre avec résumé
      [démonstration] Le canevas des métiers de la donnée et de la visualisation est né, au sein de l'association MetaCarto, d'une volonté de mieux se comprendre. La moitié des membres, issus des métiers du traitement automatique des données, avait beaucoup de mal à appréhender le métier de l'autre moitié, orientée facilitation graphique et... vice versa !
    • Le documentaliste de presse, aujourd'hui - Sonia Ben Ali, Nina Hatte p. 11 accès libre avec résumé
      [témoignage] Les spécificités, les contraintes et les évolutions de la documentation de presse, les changements apportés par le numérique, tel était le sujet d'une conférence proposée par l'ADBS Aquitaine le 15 octobre 2015.
  • Méthodes, techniques et outils

  • Droit de l'information

    • Accès aux données scientifiques et contraintes juridiques – une question d'équilibre - Herbert Gruttemeier, Thérèse Hameau p. 20-22 accès libre avec résumé
      [éclairage] Les données représentent un défi majeur pour la recherche scientifique dans la mesure où leur exploitation permet de faire émerger de nouvelles connaissances, de nouveaux sujets de recherche. Face à cet enjeu, il est primordial de clarifier les règles juridiques quant à leur accès, mise à disposition et utilisation.
    • Comment prendre des selfies en toute légalité - Marie-Andrée Weiss p. 23-24 accès libre avec résumé
      [tendance] Le selfie, cette pratique qui pouvait sembler sans conséquence, a déjà donné lieu à plusieurs procès. À côté des mises en garde dictées par ces procès, il est intéressant de se pencher sur l'analyse juridique que le selfie inspire.
    • La titularité initiale de l'auteur salarié : pierre angulaire et talon d'Achille du droit d'auteur - Stéphanie Le Cam p. 25-26 accès libre avec résumé
      [analyse] L'auteur salarié est considéré comme le titulaire des droits de propriété intellectuelle nés du fait de la création d'une œuvre de l'esprit. Ce principe de droit, qui constitue la pierre angulaire du Code de la propriété intellectuelle, rencontre pourtant en pratique de nombreuses difficultés à s'appliquer et est source d'insécurité juridique tant pour l'employeur que pour le salarié.
    • Du rififi dans l'équitable de la photocopie - Sylvie Nérisson p. 27 accès libre avec résumé
      [jurisprudence] Lorsque la photocopie est privée, à des fins d'enseignement ou de recherche, elle est généralement permise par le droit d'auteur. Des juges de Québec et Luxembourg ont ébranlé les habitudes concernant les rémunérations qui compensent cette liberté de l'utilisateur.
  • Dossier : Web de données et création de valeur : le champ des possibles

    • Web de données et création de valeurs : le champ des possibles - Gérald Kembellec, Camille Prime-Claverie p. 28-29 accès libre avec résumé avec résumé en anglais
      En 1991, le projet WorldWideWeb était rendu public dans un message Usenet et faisait ses premiers pas en dehors de l'Europe avec l'installation d'un serveur en Californie. Vingt-cinq ans et trois versions du Web plus tard, ce réseau est devenu un maillon essentiel de notre société : conçu selon un modèle statique, il est devenu social au début des années 2000 et se veut en passe de devenir sémantique. Mais que signifie exactement cette progression ? De nouveaux modèles documentaires sont-ils en train de se développer ? En tant que professionnels de la documentation, nous nous interrogeons dans ce dossier sur la place prise par les données et les métadonnées sur le Web. Nous verrons en quoi leur liaison et leur interopérabilité peuvent aboutir à la création de la valeur.
      The web of data and creation of value: the range of possibilities
      In 1991, the World Wide Web project was made public in a Usenet message and with the installation of a server in California, took its first steps outside Europe. 25 years and three versions of the Web later, this network has become an essential element of our society. Initially designed as a static model, it became social at the start of the new millenium and is becoming semantic. But what does this evolution really mean? Are new information models emerging? As information professionals, we examine the place taken by data and metadata on the Web, and describe how their linkage and networking can take us to value creation.
    • Le web de données en contexte bibliothécaire - Gérald Kembellec p. 30-31 accès libre avec résumé avec résumé en anglais
      [repères] La question du web de données a été un enjeu fort ces dernières années dans le monde de l'information-documentation ; c'est même devenu une problématique d'innovation majeure dans les centres de documentation et les bibliothèques. Après avoir parlé pendant longtemps de « silos de données » pour les catalogues électroniques des bibliothèques, la notion de liaison des « données structurées » est introduite dans le vocabulaire de l'architecte des systèmes d'information en bibliothéconomie. L'optique de cette volonté d'interopérabilité des données et métadonnées est de constituer un réseau global d'informations décrites selon des vocabulaires communs. Ce premier pôle interroge les enjeux, modèles et méthodes réels induits par ce changement et propose des exemples concrets de projets existants.
      The Web of Data in the context of libraries
      Over the last few years the Web of Data has presented a major challenge to the information profession, with an impact on major innovations in information centers and libraries. Following lengthy discussion about "data silos" pour electronic library catalogs, the notion of linking "structured data" was introduced in the vocabulary of information and library science system architects. The aim of data and metadata interoperability is to build a global information network using common vocabularies. The first section of our dossier explores the challenges, models and actual methods brought to the fore by this change and presents some concrete examples of ongoing projects.
    • Comprendre les standards du web de données - Bruno Menon p. 32-34 accès libre avec résumé
      [contexte] Pour publier sur le Web des données accessibles, exploitables, combinables entre elles et interprétables, il faut les exprimer et les décrire dans des formats et des modèles homogènes, stables, explicites et consensuels : bref, il faut se conformer aux standards – ou « langages » – élaborés par le World Wide Web Consortium. L'architecture dessinée par ces standards peut apparaître complexe au premier abord, mais il importe d'en saisir la cohérence. En voici une vue d'ensemble.
    • De la SDN à la Nuit debout : Les métadonnées et les enjeux de gouvernance internationale - Vincent Boulet p. 35-36 accès libre avec résumé
      [évolution] Le système de gouvernance des métadonnées passe d'un fonctionnement vertical à un modèle davantage déconcentré et horizontal. Les acteurs sont plus divers. L'enjeu essentiel est de concilier leurs besoins et intérêts, par définition divers, avec une mise en cohérence de la structuration des données pour pourvoir les partager librement et de plus en plus automatiquement.
    • Web de données et bibliothèques : l'évolution du modèle d'agrégation des données - Emmanuelle Bermès p. 37 accès libre avec résumé
      [action] Les enjeux du web de données ont incité les bibliothèques à faire preuve d'initiative, notamment en créant des portails orientés « entités ». Aujourd'hui, elles vont plus loin en favorisant la production de données collaboratives.
    • Démarche et usage de données liées pour le registre ReLIRE - Benjamin Duhamel p. 38-39 accès libre avec résumé
      [méthode] Des compétences métier techniques et conceptuelles sont indispensables pour comprendre, modéliser et mettre en œuvre un projet documentaire utilisant les principes du web de données. L'exemple du dispositif ReLIRE illustre ici les méthodes de regroupement et d'utilisation de données liées.
    • Des APIs Istex et Base pour les bibliothèques d'enseignement supérieur de Saint-Étienne - Caroline Bruley, David Varenne p. 40-41 accès libre avec résumé
      [illustration] Le catalogue Brise ES + est un exemple d'enrichissement notable de l'Opac par l'ajout de webservices permettant d'interroger directement des bases de référence pour la recherche.
    • Linked science et web de données - Camille Prime-Claverie p. 42-43 accès libre avec résumé avec résumé en anglais
      [perspectives] Dans le contexte du web sémantique, l'un des enjeux majeurs consiste à relier l'ensemble des connaissances culturelles et scientifiques participant ainsi au développement du Linked Open Data. Plus particulièrement, dans l'univers scientifique, la linked science est une approche visant l'interconnexion des différents objets scientifiques comme, par exemple, les publications de recherche, les données scientifiques ou les institutions de recherche, afin de rendre la recherche transparente, reproductible et interdisciplinaire.
      Linked science and Web of Data
      In the context of the semantic web, one of the major challenges is linking all cultural and scientific knowledge as they participate in the development of Linked Open Data. In particular, in the sciences "linked science" is an approach that aims to interconnect different scientific objects such as research publications, scientific data or research institutions, making research transparent, reproducible and interdisciplinary.
    • Isidore Suggestion, des recommandations de lecture pour les blogs de science - Stéphane Pouyllau p. 44 accès libre avec résumé
      [ressource] Le web sémantique et l'ouverture des données dans les SHS ont favorisé la création d'outils de recherche nouveaux se traduisant à la fois par la création de portails documentaires et d'applications pouvant être embarquées dans des sites web. Isidore, l'accès unifié aux données, publications et informations des SHS, entre dans cette catégorie.
    • Des textes augmentés avec les données du Web - Thomas Francart p. 45 accès libre avec résumé
      [zoom] Les contenus textuels peuvent bénéficier de méthodes d'enrichissement dans les hypertextes depuis des bases de connaissances sémantisées. Retour d'expérience.
    • Le développement du web des données culturelles : Les enjeux pour le ministère de la Culture et de la Communication - Bertrand Sajus, Marie-Véronique Leroi p. 46-47 accès libre avec résumé
      [expertise] Dès les années 1990, le ministère de la Culture et de la Communication a promu l'intégration et la diffusion des bases de données culturelles dans l'écosystème du Web. D'où l'importance qu'il accorde à l'interopérabilité et à l'interconnexion des données. Cet article présente les actions et projets ministériels dans le champ du web sémantique et du web des données liées.
    • L'enjeu du web de données pour les éditeurs - Jean-Paul Jorda p. 48 accès libre avec résumé
      [métier] L'éditeur EDP Sciences, propriété de sociétés savantes, publie une cinquantaine de revues internationales de recherche dans divers domaines scientifiques. C'est un acteur du « web des sciences » engagé depuis plus de 20 ans dans la révolution numérique.
    • L'enjeu du web de données pour l'édition scientifique - Lise Verlaet, Hans Dillaerts p. 49 accès libre avec résumé
      [impact] Cet article présente le concept d'éditorialisation sémantique et explicite les opportunités de l'enrichissement sémantique des publications scientifiques pour l'ensemble des acteurs de l'IST (auteurs, éditeurs et professionnels de l'information).
    • DBpédia.fr : retour sur la publication de données de la culture française - Fabien Gandon, Raphaël Boyer, Alexandre Monnin p. 50-51 accès libre avec résumé
      [enjeu] Les projets DBpédia et Semanticpédia illustrent la possibilité de réutilisation des données dans de nombreuses applications grâce à des langages et à des schémas de descriptions qui sont ici expliqués.
    • Re-Source, une archive en temps réel pour la publication et la production - Alexandre Monnin, Jérôme Denis, Nicolas Delaforge p. 52-53 accès libre avec résumé
      [initiative] Lafayette Anticipation est une fondation d'art contemporain qui met l'accent sur la production et l'accompagnement des artistes. Le projet Lafayette Re-Source, une archive sémantique en temps réel, a pour vocation de permettre le suivi de l'ensemble des activités qui contribuent à donner naissance à une œuvre. Il entend ainsi faciliter la compréhension du travail réalisé par la fondation en interne, donner au public des prises pour apprécier les œuvres dans leur déploiement (l'art en train de se faire et non l'art déjà fait) et livrer du même coup aux artistes un nouveau matériau pour la création.
    • Du web sémantique au web des données, quels enjeux professionnels ? - Jean Charlet, Gérald Kembellec p. 54-55 accès libre avec résumé avec résumé en anglais
      [application] Si quelques industriels se sont approprié le web de données dès ses prémices, principalement en recherche et développement, ses implications concrètes restent peu connues du grand public, ce qui ne signifie pas qu'il n'y ait pas d'impact tangible. En effet, les utilisations des principes du web de données sont présentes dans plusieurs aspects de l'Internet d'aujourd'hui, à commencer par leur prise en compte dans les récentes évolutions de l'algorithme du leader des moteurs de recherche.
      From the semantic web to the Web of Data, what are the issues for professionals?
      Several industrial sectors have been using the Web of Data from its inception, primarily in research and development. Although their concrete implications are little known to the general public, they have had a tangible impact. The principles of the Web of Data are used in many aspects of the Internet today, starting with their integration in recent changes to the algorithme used by the industry leader in search engines.
    • Données liées et documentation médicale - Jean Charlet p. 56-58 accès libre avec résumé
      [observation] La médecine est un des domaines où les données liées semblent pleines de promesses dans l'optique de mieux soigner les patients, de mieux accompagner le « bien-être », voire de découvrir de nouvelles connaissances médicales. Il faut pourtant faire attention à la qualité de ces données et aux modèles qui les sous-tendent, au risque d'être incapable de répondre aux espoirs mis dans ces technologies.
    • OntoToxNuc : recherche d'information et enjeux pour la collaboration et la valorisation - Anne-Claire Le Picard p. 59 accès libre avec résumé
      [travaux] Dans le cadre du programme ToxNuc, piloté par la direction des sciences du vivant du CEA, une ontologie, OntoToxNuc, a été créée. Elle répondait au besoin d'une sémantique commune dans les plate-formes collaboratives du programme. En 2014, ce référentiel, déjà conforme au standard d'interopérabilité RDF, est envisagé à l'échelle du Linked Open Data (LOD).
    • Enrichissement d'une base documentaire pour un système de recommandation dans le tourisme - Hacène Cherfi, Ghislain Atemezing, Florence Amardeilh, François Rouzé p. 60-62 accès libre avec résumé
      [pratique] Cet article présente un moteur qui permet de recommander des « expériences à vivre » dans le domaine du tourisme en s'appuyant sur les inspirations de l'utilisateur. Le moteur compare ces inspirations aux expériences à vivre décrites dans une base de connaissances. Le système analyse des contraintes parfois complexes liées aux caractéristiques des destinations et aux souhaits de l'utilisateur afin de lui proposer la destination associée à l'expérience à vivre la plus pertinente.
    • Écrire avec une machine à calculer, écrire pour une machine à calculer - Stéphane Crozat p. 62-64 accès libre avec résumé
      [orientation] Les chaînes éditoriales ont opéré une transformation de l'acte d'écriture en rendant le calcul accessible aux auteurs. Avec le web des données, elles doivent à présent se préoccuper de rendre accessibles le contenu aux machines.
    • Que voit réellement Google de la sémantique des pages web ? - Gérald Kembellec p. 65 accès libre avec résumé
      [focus] Avec Google Panda, Penguin et Hummingbird, dernières évolutions de l'algorithme de Google ces dernières années, la qualité des données et métadonnées devient un argument important pour l'optimisation de référencement naturel des pages web.
    • ELI : une « mise en lien » des textes juridiques européens - Thomas Francart, Jean Delahousse p. 66-67 accès libre avec résumé
      [approche] À l'initiative des Journaux officiels européens, un web de données juridiques nommé ELI (European Legislation Identifier) a vu le jour en 2015. Déjà adopté par quelques États précurseurs, il est déployé actuellement par d'autres États membres, sur la base du volontariat.
    • Sources & ressources - Adriana Lopez-Uroz p. 68-69 accès libre
  • Recherche en sciences de l'information

    • Classification automatisée : rêve ou réalité ? Analyse critique de l'usage du text mining pour la conception de vocabulaires contrôlés - Raphaël Hubain, Seth van Hooland, Ruben Verborgh p. 70-79 accès libre avec résumé avec résumé en anglais
      [étude] L'usage du traitement automatique des langues pour la classification et l'annotation documentaire reste aujourd'hui un rêve plus qu'une réalité. Pourtant, plus que jamais, les organisations font face à de grandes difficultés dans la gestion de leurs documents. Les vocabulaires contrôlés permettent certes d'organiser les contenus, mais toutes les organisations ne disposent pas de ressources suffisantes pour en implémenter. Au travers d'une étude de cas dans le secteur pharmaceutique, les auteurs de cet article, Raphaël HUBAIN, Seth van HOOLAND et Ruben VERBORGH, démontrent comment un établissement de taille réduite peut concevoir un vocabulaire contrôlé et indexer sémantiquement ses contenus et ce, sans dépendance vis-à-vis d'un fournisseur de logiciel grâce à des outils open source. Les données d'évaluation sont mises à disposition afin d'appliquer la méthodologie à d'autres domaines d'application.
      Automatic classification, dream or reality? A critical analysis of how text mining is used to design controlled vocabularies
      Using automatic language processing for classifying and annotating is today still more a dream than reality. Nevertheless, more than ever, organizations have to deal with the great difficulty of document management. Controlled vocabularies may help with organizing content, but not all organizations have sufficient resources to implement these. In a case study in the pharmaceutical sector, our authors Raphaël Hubain, Seth van Hooland and Ruben Verborgh, show how a relatively small company can design a controlled vocabulary and semantically index its contents. With open source tools, there is little need to depend on a software provider. Assessment data are available for applying the methodology to other sectors of activity.
  • Notes de lecture