Vision par ordinateur

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

La vision par ordinateur (aussi appelée vision artificielle ou vision numérique) est une branche de l'intelligence artificielle dont le principal but est de permettre à une machine d'analyser, traiter et comprendre une ou plusieurs images prises par un système d'acquisition (par exemple: caméras, etc.). [1]

Vue d'artiste d'un Rover automatique explorant la surface de Mars. Il est équipé sur son sommet de deux caméras vidéo lui conférant une vision stéréoscopique.


Une approche consiste à tenter d'imiter la vision humaine ou animale (ex : vision à larges champs de certains oiseaux, de certains insectes par exemple dotés d'yeux à facettes par exemple, ou vision nocturne...) par le truchement de composants électroniques. Cette manière de procéder peut être perçue comme un traitement des données visuelles par le biais de modèles basés sur la géométrie, la physique, la biologie, les statistiques et la théorie d’apprentissage. La vision par ordinateur a aussi été décrite comme une initiative dans l'automatisation et l’intégration d’une vaste gamme de processus et de modèles sur la perception visuelle.

Applications[modifier | modifier le code]

Les applications vont de la vision industrielle (par exemple dans l’industrie de fabrication de bouteilles), à la recherche dans le domaine de l’intelligence artificielle et des ordinateurs ou robots capables de « comprendre » le monde qui les entoure. La vision par ordinateur et la vision industrielle sont des domaines qui se croisent ou se confondent assez souvent.

  • La vision par ordinateur recouvre la technologie centrale de l’analyse d'image automatique, qui est utilisée dans de nombreux contextes ;
  • La vision industrielle fait plutôt référence à une combinaison de techniques d'analyse d’image automatique, de mise en correspondance, de traitement de l'image acquise par caméra (éventuellement stéréoscopique) et de technologies d'acquisition d'image, par exemple, pour inspecter des objets ou des lieux, de façon automatique, afin d'orienter des robots ou de permettre le déroulement d'un processus industriel.

Dans les deux cas, l'image est parfois acquise dans des gammes de longueur d'onde que l'homme ne perçoit pas (infra-rouge, ultraviolet, rayon x, etc.) ou à travers une paroi et parfois par des capteurs spéciaux, par exemple adaptés à des milieux extrêmes tels que l'intérieur de certaines installations nucléaires, fours industriels, accélérateur de particule, etc.).

En tant que discipline scientifique, la vision par ordinateur traite de la théorie qui se trouve derrière les systèmes de traitement de l'information (information contenue dans les images ou pouvant être déduite d'une analyse plus contextuelle). Les données extraites le sont sous différentes formes : séquences vidéo, vues depuis différentes caméras, données multidimensionnelles provenant d'un scanner (scanner médical ou industriel).

En tant que discipline technologique, la vision par ordinateur cherche à appliquer ses théories et ses modèles à différents systèmes. Quelques exemples de systèmes d’application de la vision par ordinateur :

  • Procédés de contrôle, p. ex. dans la robotique industrielle
  • Navigation, p. ex. dans un véhicule autonome ou un robot mobile
  • Détection d’événements, p. ex. pour la surveillance ou le comptage automatique de personnes
  • Organisation d'informations, p. ex. pour indexer des bases de données d’images et de suites d’images
  • Modélisation d'objets ou d'environnements, p. ex. dans l’analyse d’image médicale ou la topographie
  • Interaction, p. ex. en tant que dispositif d’entrée pour une interaction homme-machine
  • Inspection automatique, p. ex. dans des domaines de production

On considère comme sous-domaines de la vision par ordinateur la reconstruction de scène, la détection d’événements, la détection d'intrusion, le match moving, la reconnaissance d'objets, l’estimation de mouvement, ainsi que certaines formes d'apprentissage automatique, d'indexation, de restauration d'image, etc.

Dans la plupart des applications pratiques de la vision par ordinateur, les ordinateurs sont préprogrammés pour effectuer une certaine tâche, mais les méthodes basées sur l’apprentissage sont de plus en plus populaires.

Les problèmes posés par la modélisation de la vision sont loin d'être résolus.

Techniques utilisées en vision par ordinateur[modifier | modifier le code]

Disciplines connexes[modifier | modifier le code]

Notes et références[modifier | modifier le code]

Voir aussi[modifier | modifier le code]

Articles connexes[modifier | modifier le code]

Liens externes[modifier | modifier le code]

Bibliographie[modifier | modifier le code]