Traitement d'image: Que sont les occlusions?

Question

Je développe un projet de traitement d'image et je rencontre le mot occlusion dans de nombreux articles scientifiques, que signifient les occlusions dans le contexte du traitement d'images? Le dictionnaire donne seulement une définition générale. Quelqu'un peut-il les décrire en utilisant une image comme contexte?

Hannes Ovr&#233;n · Accepted Answer

Occlusion signifie qu'il y a quelque chose que vous voulez voir, mais ne peut pas en raison d'une propriété de votre configuration de capteur, ou d'un événement . La façon exacte dont elle se manifeste ou la façon dont vous traitez le problème vont varier en raison des problème à portée de main.

Quelques exemples:

Si vous développez un système qui suit les objets (personnes, voitures, ...), une occlusion se produit si un objet que vous suivez est masqué (occulté) par un autre objet. Comme deux personnes qui se croisent ou une voiture qui passe sous un pont ... Le problème dans ce cas-ci est ce que vous faites quand un objet disparaît et réapparaît.

Si vous utilisez une caméra range , l'occlusion est une zone dans laquelle vous ne disposez d'aucune information. Certaines caméras de télémétrie laser fonctionnent en transmettant un faisceau laser sur la surface que vous examinez, puis en disposant d'une configuration de caméra qui identifie le point d'impact de ce laser sur l'image résultante. Cela donne les coordonnées 3D de ce point. Cependant, étant donné que la caméra et le laser ne sont pas nécessairement alignés, il peut y avoir des points sur la surface examinée que la caméra peut voir mais que le laser ne peut pas frapper (occlusion) .

La même chose peut se produire dans imagerie stéréo s'il y a des parties de la scène qui ne sont vues que par l'une des deux caméras. Aucune donnée de distance ne peut évidemment être collectée à partir de ces points.

Il y a probablement plus d'exemples.

Si vous précisez votre problème, nous pourrons peut-être définir ce qu’est l’occlusion et les problèmes qu’elle entraîne.

kmario23 · Answer

Le problème de l'occlusion est l'une des principales raisons pour lesquelles la vision par ordinateur est difficile en général. Plus précisément, ceci est beaucoup plus problématique dans Object Tracking. Voir les figures ci-dessous:

Notez que le visage de la femme est pas complètement visible dans les cadres 0519 & 0835, contrairement au visage dans le cadre 0005.

Et voici une autre photo où le visage de l'homme est partiellement caché dans les trois cadres.

Notez dans l'image ci-dessous comment le suivi du couple dans le cadre de sélection rouge et vert est perdu dans le cadre du milieu en raison d'une occlusion (c'est-à-dire partiellement masqué par une autre personne devant eux) mais correctement suivi cadre quand ils deviennent (presque) complètement visibles.

Courtoisie d'image: Stanford, USC

Arun Sooraj · Answer

L'occlusion est celle qui bloque notre vue. Dans l'image montrée ici, nous pouvons facilement voir les personnes qui se trouvent au premier rang. Mais la deuxième rangée est partiellement visible et la troisième rangée est beaucoup moins visible. Ici, nous disons que la deuxième ligne est partiellement obstruée par la première ligne et que la troisième ligne est obstruée par les première et deuxième lignes. On peut voir de telles occultations dans les salles de classe (élèves assis en rangées), dans les carrefours (véhicules en attente de signal), dans les forêts (arbres et plantes), etc., lorsqu'il y a beaucoup d'objets.

altaf ur Rahman · Answer

Comme les autres réponses ont bien expliqué l’occlusion, je n’ajouterai rien à cela. Fondamentalement, il existe un écart sémantique entre nous et les ordinateurs.

En réalité, l’ordinateur voit chaque image comme la séquence de valeurs, généralement comprise entre 0 et 255, pour chaque couleur de l’image RVB. Ces valeurs sont indexées sous la forme (rangée, col) pour chaque point de l’image. Donc, si les objets changent de position par rapport à la caméra là où se cache un aspect de l’objet (les mains d’une personne ne sont pas affichées), l’ordinateur verra des numéros différents (ou des bords ou toute autre caractéristique), ce qui changera l’algorithme détecter, reconnaître ou suivre l'objet.