Vision par ordinateur
|
|
Cet article est une ébauche concernant l’informatique.
Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants.
|
La vision par ordinateur (aussi appelée vision artificielle ou vision numérique) est une branche de l'intelligence artificielle dont le but est de permettre à une machine de comprendre ce qu'elle « voit » lorsqu'on la connecte à une ou plusieurs caméras. L’un des thèmes développés dans ce domaine est celui de l’imitation de la vision humaine par le moyen de composants électroniques. Cette manière de procéder peut être perçue comme un traitement des données visuelles par le biais de modèles basés sur la géométrie, la physique, les statistiques et la théorie d’apprentissage. La vision par ordinateur a aussi été décrite comme une initiative dans l’automatisation et l’intégration d’une vaste gamme de processus et de modèles sur la perception visuelle.
Sommaire |
Applications [modifier]
Les applications vont de la vision industrielle, présente notamment dans l’industrie de fabrication de bouteilles, à la recherche dans le domaine de l’intelligence artificielle et des ordinateurs ou robots capables de comprendre le monde qui les entoure. La vision par ordinateur et la vision industrielle sont des domaines qui se croisent assez souvent. La vision par ordinateur recouvre la technologie centrale de l’analyse d’image automatique, qui est utilisée dans de nombreux domaines. La vision industrielle fait en général référence à la combinaison entre l’analyse d’image automatique et les technologies, afin de pouvoir inspecter de façon automatique et d’orienter les robots à fin d’applications industrielles.
En tant que discipline scientifique, la vision par ordinateur traite de la théorie qui se trouve derrière les systèmes qui traitent des images. Les données extraites se trouvent sous différentes formes: séquences vidéo, vues depuis différentes caméras, ou des données multidimensionnelles lorsqu’elles proviennent d’un scanner médical.
En tant que discipline technologique, la vision par ordinateur cherche à appliquer ses théories et ses modèles à différents systèmes. Quelques exemples de systèmes d’application de la vision par ordinateur :
- Procédés de contrôle, p. ex. dans la robotique industrielle
- Navigation, p. ex. dans un véhicule autonome ou un robot mobile
- Détection d’événements, p. ex. pour la surveillance ou le comptage automatique de personnes
- Organisation d'informations, p. ex. pour indexer des bases de données d’images et de suites d’images
- Modélisation d'objets ou d'environnements, p. ex. dans l’analyse d’image médicale ou la topographie
- Interaction, p. ex. en tant que dispositif d’entrée pour une interaction homme-machine
- Inspection automatique, p. ex. dans des domaines de production
On considère comme sous-domaines de la vision par ordinateur la reconstruction de scène, la détection d’événements, le match moving, la reconnaissance d’objets, l’apprentissage, l’indexation, l’estimation de mouvement, et la restauration d’image.
Dans la plupart des applications pratiques de la vision par ordinateur, les ordinateurs sont préprogrammés pour effectuer une certaine tâche, mais les méthodes basées sur l’apprentissage sont de plus en plus populaires.
Les problèmes posés par la modélisation de la vision sont encore loin d'être résolus.
Techniques utilisées en vision par ordinateur [modifier]
Disciplines connexes [modifier]
- Traitement d'image
- Reconnaissance de formes & localisation : La reconnaissance de forme consiste en l'apprentissage d'une forme de référence suivie de sa recherche dans une image. Cette technique peut être utilisée afin de vérifier la conformité d'une forme ou bien afin de localiser une forme dans le but de faire un recalage.
- Vérification de caractères (OCV) : Cette technique consiste à vérifier si la chaîne de caractères présente dans une image est bien conforme à la chaîne de référence. Ne pas confondre avec OCR.
- Reconnaissance optique de caractères : Contrairement à l'OCV, ici il n'existe pas de chaîne de référence. L'image est analysée afin de déterminer quelle chaîne de caractères s'y trouve.
- Mesure : À partir de l'image d'un objet, il est possible de mesurer sa taille en pixels. Si le système dispose d'une calibration, il sera alors aussi en mesure de donner un résultat en unités réelles telles que le millimètre, le pouce, ...
- Identification de couleurs
- Détection de zones d'intérêt
- Photogrammétrie
- Vision industrielle
Voir aussi [modifier]
- OpenCV, bibliothèque spécialisée dans le traitement d'images et la vision par ordinateur.