Titre | Les machines y voient-elles quelque chose ? | |
---|---|---|
Auteur | Denis Bonnay | |
Revue | Astérion | |
Numéro | no 25, 2021 Philosophies de la vision | |
Rubrique / Thématique | Dossier |
|
Résumé |
La vision par ordinateur est un des domaines de l'intelligence artificielle qui connaît les succès les plus fulgurants. Depuis une vingtaine d'années, les machines n'ont cessé de progresser dans leur capacité à extraire des informations à partir d'images et à identifier des objets. Mais faut-il en conclure que ces machines sont littéralement des machines voyantes, ou ne s'agit-il que d'une façon imagée de décrire des capacités de détection ? Le présent article se propose de fournir les bases d'une réponse raisonnée à cette question. Nous examinons successivement trois types de conditions d'attribution de la vision, et soutenons que le critère fonctionnaliste, en termes de représentations internes de stimuli visuels exploitables à diverses fins, doit être préféré aux critères behavioriste ou phénoménologique. Ce critère fonctionnaliste est ensuite appliqué à une des technologies les plus utilisées dans le domaine de la vision par ordinateur, celle des réseaux de neurones et plus particulièrement des réseaux convolutifs. Nous soutenons alors que de tels réseaux sont bien capables de voir, précisément dans la mesure où ils sont entraînés pour produire des représentations à partir de données visuelles. Ces représentations ont des traits spécifiques associés à un entraînement réussi : elles sont hiérarchiques, versatiles et robustes. De telles propriétés ont un intérêt théorique au-delà de leur domaine d'origine : nous suggérons pour finir qu'elles pourraient être utilisées pour spécifier la nature de la fonction de représentation et résoudre certains des problèmes classiques auxquels font face les théories téléosémantiques de la représentation comme celle de Dretske. Source : Éditeur (via OpenEdition Journals) |
|
Résumé anglais |
Computer vision is one of AI's most successful fields. In the last twenty years, machines have become increasingly good at extracting information from images and at identifying objects. But does this mean that machines really can see, or is computer vision just a fancy metaphor for object detection? This paper aims to provide a reasoned answer to the question. First, three criteria for vision attribution are reviewed and it is argued that a functionalist criterion, in terms of exploitable internal representations based on visual stimuli, fares better than behaviourist or phenomenological ones. The functionalist criterion is then applied to vision algorithms based on neural networks and it is argued that such machines can indeed see, insofar as neural networks are precisely trained to generate representations of the visual data they are fed with. Those representations present the specific traits associated with successful training: They are hierarchical, robust, and versatile. We argue that these properties may be used as further constraints on representational devices in general, helping to solve some of the classical issues faced by teleosemantic theories of representation such as that expounded by Dretske. Source : Éditeur (via OpenEdition Journals) |
|
Article en ligne | http://journals.openedition.org/asterion/7611 |