Contenu du sommaire : Dossier. L'intelligence artificielle

Revue I2D - Information, données & documents (anciennement : Documentaliste - Sciences de l'information) Mir@bel
Titre à cette date : i2D : information, données et documents : pratiques & recherche
Numéro no 1, juillet 2022
Titre du numéro Dossier. L'intelligence artificielle
Texte intégral en ligne Accès réservé
  • L'IA, de la SF à une réalité - Danielle Dufour-Coppolani p. 7 accès réservé
  • L'intelligence artificielle dans le secteur de l'information et de la documentation : défis, impacts et perspectives - Ghislaine Chartron, Antoine Raulin p. 8-12 accès réservé avec résumé
    Présente à toutes les étapes du cycle de l'information, l'IA fait évoluer les pratiques documentaires et lance de nouveaux défis pour gérer et valoriser l'information. Dans un environnement en pleine évolution, il s'agit ici de démystifier le sujet de l'IA et d'éclairer les acteurs du champ de l'information professionnelle et scientifique : ce numéro spécial IA offre des repères technologiques et juridiques, présente quelques usages matures et impacts réels de l'IA dans trois domaines clés du secteur de l'info-doc, et donne à réfléchir sur l'évolution des compétences et des métiers qui y sont adossés.
  • L'intelligence artificielle dans la gestion et la valorisation de l'information : clés de repérage (histoire et analyse) - Antoine Raulin p. 14-21 accès réservé avec résumé
    Depuis son apparition dans les années 50, l'intelligence artificielle a énormément progressé. La capacité accrue du calcul machine, l'apprentissage automatique, perfectionné avec des algorithmes puissants, et optimisé par des approches combinatoires tirant profit des technologies de la langue, l'ont portée à un stade d'industrialisation avancé, si bien qu'elle est en passe d'opérer une véritable synergie entre l'intelligence créative de l'être humain et les capacités de traitement de l'information ou de la communication multimédia. Aujourd'hui, grâce aux briques IA construites autour de corpus Big Data, de règles et d'apprentissages poussés, et d'algorithmes de décision sophistiqués, on peut effectuer des traitements de masse à grande échelle, qui seraient impossibles à appréhender par la seule approche humaine. Présente à toutes les étapes du cycle de l'information (classification, génération, prédiction…), l'IA révolutionne les pratiques et les métiers documentaires : elle ouvre de nouvelles possibilités pour gérer et valoriser les contenus, qui sont autant de défis.
  • Quelle réglementation européenne sur l'intelligence artificielle ? - Antoine Petel p. 22-28 accès réservé avec résumé
    L'Artificial Intelligence Act est une proposition législative publiée par la Commission européenne le 21 avril 2021. Ce texte est une nouvelle illustration de la « troisième voie » numérique développée par l'Union européenne pour concilier le besoin d'innover avec la nécessité de respecter les droits et les valeurs européennes. La définition juridique de cet équilibre est complexe et la proposition d'Artificial Intelligence Act n'y fait pas exception.
  • Les technologies de l'intelligence artificielle au service des médias et des éditeurs de contenus : traitement du langage naturel (TAL) - Christian Langevin p. 30-37 accès réservé avec résumé
    Cet article présente les technologies d'IA relevant du Traitement du langage naturel (TAL, ou Traitement automatique du langage naturel (TALN) et leurs usages dans le secteur des médias et de l'édition. Une première partie présente les principales fonctions du TALN puis analyse les circonstances économiques et les usages pour lesquels ces technologies peuvent être mises en œuvre. Une deuxième partie fait un panorama des contextes de mise en œuvre des solutions de TALN et donne quelques exemples pratiques de cas d'usage en conditions opérationnelles.
  • Découvrir et enrichir des connaissances à partir de l'analyse de documents grâce à l'intelligence artificielle : l'exemple de la plateforme Kairntech - Vincent Nibart p. 38-43 accès réservé avec résumé
    Quand il s'agit d'organiser ou de rendre accessibles des informations complexes, ou d'aider les chercheurs ou analystes à découvrir de nouvelles informations, les vocabulaires structurés (lexiques, dictionnaires, thésaurus, taxonomies…) et plus largement les bases de connaissance, jouent un rôle important. Mais encore faut-il les mettre constamment à jour, ce qui représente une tâche longue, fastidieuse et difficile. Le cas de la veille juridique illustre bien ce problème. Dès lors, une assistance devient indispensable : à partir d'un vocabulaire d'amorçage, la plateforme Kairntech, accessible à des non-informaticiens, permet de gérer et d'analyser de grandes quantités de documents, de mettre à jour des vocabulaires métiers et des bases de connaissance, et ainsi d'économiser un temps considérable.
  • L'intelligence artificielle au service du monde des fusions acquisitions : la plateforme Sealk - Gilles Pouzenc p. 44-49 accès réservé avec résumé
    L'émergence des startups dans les économies mondiales et l'arrivée massive des fonds d'investissement ont bousculé le monde des affaires depuis les années 2000, posant le problème de l'information d'une manière aiguë. Dans ce monde prolifique et bouillonnant, le réseau personnel et les bases de données manuelles ne suffisent plus : les nouvelles technologies, en particulier l'intelligence artificielle, viennent révolutionner la recherche de cibles dans une stratégie d'acquisition d'entreprises (M&A). Ainsi, la plateforme Sealk (en phase de pré-commercialisation), utilise l'IA pour collecter des informations récentes et pertinentes sur les startups ou les PME/PMI, mais aussi de manière prédictive : à partir de l'analyse des opérations de fusion ou d'acquisition, tel grand groupe peut anticiper - prévoir quelle start-up acquérir s'il veut ne pas prendre de retard sur ses concurrents ; inversement, une start-up peut chercher à quels grands groupes s'adosser. Cette solution puissante et originale, destinée aux banquiers d'affaires, aux fonds d'investissement et aux grands groupes, ne requiert aucune connaissance en programmation.
  • Maîtriser l'algorithme pour favoriser les interactions : du bon usage des recommandations personnalisées : Utilisation et approche de l'IA par le portail Cairn.info - Jean-Baptiste de Vathaire p. 50-56 accès réservé avec résumé
    Portail de publications francophones en sciences humaines et sociales, Cairn.info propose depuis peu des recommandations personnalisées, générées de façon automatique. Fondées principalement sur l'analyse sémantique des documents grâce aux technologies de traitement automatique du langage, ces recommandations sont déployées avec prudence, afin d'une part de laisser l'utilisateur maître de ses propres recherches, d'autre part de privilégier une compréhension plus large des interactions entre publications scientifiques.
  • Accompagner les professionnels du Droit avec des solutions fondées sur l'intelligence artificielle et la sémantique : la plateforme de LexisNexis - Mathieu Balzarini, Christophe Favart p. 57-63 accès réservé avec résumé
    Les métiers du Droit, loin de l'image parfois traditionnelle qu'on leur prête, sont aux avant-postes de nombreuses innovations technologiques. Le monde du droit investit en effet de plus en plus dans les solutions d'aide à la décision reposant fortement sur l'intelligence artificielle. Ainsi LexisNexis, leader de l'information juridique numérique, avec sa plateforme d'information et d'Analytics juridiques Lexis 360®Intelligence, a placé l'IA au cœur de ses développements : non pas pour remplacer le raisonnement juridique, mais pour faciliter le travail des juristes, les libérer des tâches chronophages et leur permettre de se consacrer aux sujets à valeur ajoutée. Il s'agit de promouvoir une intelligence juridique qui associe l'humain et la technologie de façon vertueuse et responsable.
  • Lis mon livre, ou la lectrice artificielle des personnes âgées - Laurent Le Meur p. 64-65 accès réservé avec résumé
    Grâce aux technologies d'IA intégrées dans des enceintes connectées, les personnes âgées malvoyantes pourront très bientôt accéder à une médiathèque de 40 000 livres audio de manière autonome, sans avoir à manipuler un clavier ou un écran. Cette médiathèque, créée au sein du projet européen Lis mon livre, par l'Association Valentin Haüy, l'une des principales associations françaises de personnes handicapées visuelles, a déjà été adoptée par d'autres associations, au Canada et en Norvège.
  • L'intelligence artificielle face à la désinformation : problème autant que solution ? - Denis Teyssou p. 66-72 accès réservé avec résumé
    Face à la désinformation, l'intelligence artificielle fait-elle partie du problème ou de la solution ? Ou des deux à la fois ? Le projet européen WeVerify (2018-2021), auquel vient de participer l'AFP, a élaboré plusieurs outils de vérification de l'information utilisés par des milliers de journalistes et fact-checkeurs.Retour sur expérience.
  • L'intelligence artificielle au défi du multilinguisme : usages et perspectives de la traduction automatique neuronale dans la communication scientifique - Susanna Fiorini p. 73-76 accès réservé avec résumé
    Au vu des récentes avancées en termes de performances et accessibilité, la traduction automatique neuronale apparaît comme la solution pour briser les barrières linguistiques freinant la circulation de l'information et des savoirs. Son rôle deviendrait donc déterminant dans un paysage à dominante anglophone comme la communication scientifique, qui pourrait ainsi se projeter vers un multilinguisme systématique. Les études réalisées jusqu'à aujourd'hui montrent cependant une réalité plus nuancée, qui fait certes ressortir les bénéfices de ces outils, mais également leurs limites : exploitation opaque des données des utilisateurs, biais et effet « boîte noire », contraintes linguistiques, textuelles et disciplinaires, usages peu éclairés, méconnaissance du paysage des technologies disponibles. Dans ce contexte, les réflexions sur les usages et perspectives de la traduction automatique dans la communication scientifique trouvent tout leur sens et montrent la nécessité de mettre en place des solutions ad hoc afin que ces technologies puissent réellement répondre aux besoins des communautés scientifiques.
  • Une intelligence artificielle pour contextualiser les citations des publications scientifiques - Maha Amami, Yann Mahé p. 77-81 accès réservé avec résumé
    Dépasser le biais du simple critère quantitatif : tel est l'enjeu pour l'évaluation de la recherche aujourd'hui. En effet, l'impact du travail d'un chercheur se mesure encore trop souvent au nombre d'articles dans lesquels ses propres articles ont été cités. Or dans sa tâche d'écriture, un auteur pose un œil critique sur chacun des articles qu'il cite ; il peut ne citer un article que pour le situer chronologiquement par rapport à l'état de l'art, et exprimer un avis neutre à son propos ; il peut aussi présenter les limites des méthodes énoncées dans l'article cité ou critiquer son processus d'expérimentation ; il peut enfin apprécier le travail de l'article cité, et l'utiliser pour la construction de son approche. C'est pour tenir compte de ces nuances et de ce contexte des citations (qui en soi constitue déjà une forme d'évaluation…) que l'équipe de data scientists de MyScienceWork a entraîné un algorithme Open Source et développé trois modèles d'analyse. Les informations extraites des publications via cet outil ouvrent de nouvelles perspectives d'analyse contextuelle des citations, en les assortissant d'étiquettes d'avis, de type et de sentiment.
  • Intelligence artificielle et curation humaine : MEDLINE 2022, projet d'indexation automatisée mené par la National Library of Medicine - Marie-Laure André-Bourguet p. 82-86 accès réservé avec résumé
    Accélérer la découverte, améliorer la santé et les soins : les enjeux de l'information biomédicale sont de taille. Pour faire face au nombre accru de publications à indexer, et mettre les références à disposition de ses utilisateurs dans un délai très rapide, la Bibliothèque américaine de médecine (National Library of Medicine - NLM), la plus grande bibliothèque médicale du monde, a lancé en 2018 MEDLINE 2022. Ce projet consiste à passer à l'indexation MeSH automatisée des citations MEDLINE dans PubMed, via un puissant algorithme, Medical Text Indexer (MTI), sans cesse perfectionné, qui aide les indexeurs en leur suggérant le terme le plus pertinent. D'ici la mi-2022, toutes les références devraient être indexées, mais l'intervention humaine reste indispensable : elle aura toujours un rôle à jouer dans le contrôle et l'assurance-qualité.
  • Tendances et perspectives de l'intelligence artificielle dans le secteur de l'information-documentation : vision prospective R&D et applications dans le monde des affaires : L'analyse et la vision du Président de Cap Digital - Charles Huot p. 88-96 accès réservé avec résumé
    L'intelligence artificielle envahit le monde. Le secteur de l'information et de la documentation ne lui échappe pas d'autant qu'il est en réalité l'un des tout premiers secteurs sur lequel elle a fait ses armes et forgé ses premières victoires. Indexation automatique, moteur de recherche, traduction automatique, reconnaissance d'image, analyse sémantique de contenu, Text Mining, résumé automatique et plus généralement, traitement automatique des langues, étaient les prémisses de cette révolution bouleversante qu'apporte l'IA. Est-ce à dire que tout a été réalisé ? Certes non ! De nouvelles approches, fondées sur des données multimodales et des modèles de langage prometteurs, tels que Embedded Word, Bert, GPT, font l'objet de travaux très importants en R&D. Ces dernières innovations s'intègrent au sein de développements logiciels de plus en plus utilisés dans le monde des affaires, notamment de la presse, de l'édition et de la production cinématographique.
  • Intelligence artificielle & Sciences humaines et sociales (SHS) : opportunités, défis et perspectives - Nicolas Sauret p. 97-103 accès réservé avec résumé
    L'intelligence artificielle s'impose désormais dans tous les domaines des sciences humaines et sociales, lesquelles accueillent cette nouvelle approche à la fois en tant que méthodologie de traitement des données, et en tant qu'objet de recherche à part entière. Signe d'un second tournant numérique de la recherche, cet engouement témoigne de la convergence entre les besoins en traitement massif des données de la recherche et des archives patrimoniales, après les larges campagnes de numérisation opérées lors de ces dernières décennies, et avec la maturation des méthodes d'apprentissage automatique et profond. Pour autant, cette accessibilité des méthodes de l'IA n'est pas sans poser certains défis aux communautés SHS : défis en termes de compétences et de ressources nécessaires, mais aussi en termes d'enjeux scientifiques, épistémologiques et éthiques.
  • La diffusion libre de l'information à l'heure du web3 et des blockchains - Alain Broustail p. 104-107 accès réservé avec résumé
    Le succès populaire des cryptomonnaies et autres NFT (Non-Fungible Token) repose sur l'utilisation de la technologie blockchain. Ouverte, transparente et sécurisée, cette technologie, fondée sur un internet décentralisé (web3), permet aux esprits libertariens de se projeter dans un monde où l'information serait librement diffusée, sa source accessible à tous et non manipulable. Entre contraintes éthico-techniques et solutions créatives, le concept du web3, encore très innovant, mérite d'être plus connu.
  • Sources et ressources bibliographiques - Antoine Raulin p. 108-110 accès réservé