web-dev-qa-db-fra.com

Reconnaissance du logo en images

Quelqu'un connaît-il des travaux universitaires récents qui ont été effectués sur la reconnaissance de logo en images? Veuillez ne répondre que si vous êtes familier avec ce sujet spécifique (je peux rechercher moi-même "reconnaissance de logo" sur Google, merci beaucoup). Quiconque est compétent en vision par ordinateur et a effectué des travaux sur la reconnaissance d'objets est également invité à commenter.

Mise à jour: Veuillez vous référer aux aspects algorithmiques (quelle approche vous pensez appropriée, les articles sur le terrain, si cela devrait fonctionner (et a été testé) pour les données du monde réel, les considérations d'efficacité) et non la technique côtés (le langage de programmation utilisé ou que ce soit avec OpenCV ...) Le travail sur l'indexation d'images et la récupération d'images basée sur le contenu peut également aider.

57
elijah

Vous pouvez essayer d'utiliser des fonctionnalités locales comme SIFT ici: http://en.wikipedia.org/wiki/Scale-invariant_feature_transform

Cela devrait fonctionner car la forme du logo est généralement constante, les fonctionnalités extraites doivent donc bien correspondre.

Le flux de travail sera comme ceci:

  1. Détecter les coins (par exemple le détecteur de coin Harris) - pour le logo Nike, ce sont deux extrémités pointues.

  2. Descripteurs de calcul (comme SIFT - vecteur entier 128D)

  3. Au stade de l'entraînement, souvenez-vous d'eux; sur l'étape correspondante, trouvez les voisins les plus proches pour chaque fonction de la base de données obtenue pendant la formation. Enfin, vous avez un ensemble de correspondances (certaines sont probablement fausses).

  4. Déterminez les correspondances incorrectes en utilisant RANSAC. Ainsi, vous obtiendrez la matrice qui décrit la transformation d'une image de logo idéale en une image où vous trouverez le logo. Selon les paramètres, vous pouvez autoriser différents types de transformations (uniquement la traduction; la traduction et la rotation; la transformation affine).

Le livre de Szeliski comporte un chapitre (4.1) sur les caractéristiques locales. http://research.Microsoft.com/en-us/um/people/szeliski/Book/

P.S.

  1. J'ai supposé que vous vouliez trouver des logos sur les photos, par exemple trouver tous les panneaux d'affichage Pepsi, afin qu'ils puissent être déformés. Si vous avez besoin de trouver un logo de chaîne de télévision sur l'écran (afin qu'il ne soit pas tourné et mis à l'échelle), vous pouvez le faire plus facilement (correspondance de motifs ou autre).

  2. Le SIFT conventionnel ne prend pas en compte les informations de couleur. Étant donné que les logos ont généralement des couleurs constantes (bien que la couleur exacte dépende de la foudre et de la caméra), vous voudrez peut-être prendre en compte les informations sur les couleurs.

38
Roman Shapovalov

Nous avons travaillé sur la détection/reconnaissance de logo dans des images du monde réel. Nous avons également créé un ensemble de données FlickrLogos-32 et l'avons rendu public, y compris les données, la vérité sur le terrain et les scripts d'évaluation.

Dans notre travail, nous avons traité la reconnaissance de logo comme un problème de récupération afin de simplifier la reconnaissance multi-classes et de permettre à ces systèmes d'être facilement évolutifs pour de nombreuses (par exemple des milliers) classes de logo.

Récemment, nous avons développé une technique de regroupement appelée Bundle min-Hashing qui regroupe les configurations spatiales de plusieurs entités locales en ensembles de caractéristiques très distinctifs. La représentation d'ensemble est utilisable à la fois pour la récupération et la reconnaissance. Voir les exemples de cartes thermiques suivants pour les détections de logo:

enter image description hereenter image description here

Vous trouverez plus de détails sur les opérations internes, les applications potentielles de l'approche, les expériences sur ses performances et bien sûr aussi de nombreuses références à des travaux connexes dans les articles [1][2] .

31
Stefan

A travaillé sur cela: la correspondance et la récupération des marques de commerce dans les bases de données de vidéos sportives obtiennent un PDF du document: http://scholar.google.it/scholar?cluster=9926471658203167449hl=enas_sdt= 20

Nous avons utilisé SIFT comme descripteurs de marques et d'images, et une correspondance de seuil normalisée pour calculer la distance entre les modèles et les images. Dans nos derniers travaux, nous avons pu réduire considérablement le calcul en utilisant des méta-modèles, créés en évaluant la pertinence des points SIFT qui sont présents dans différentes versions de la même marque.

Je dirais qu'en général, travailler avec des vidéos est plus difficile que de travailler sur des photos en raison de la très mauvaise qualité visuelle des normes TV actuellement utilisées.

Marco

7
Marco

J'ai travaillé sur un projet où nous devions faire quelque chose de très similaire. Au début, j'ai essayé d'utiliser les techniques de formation Haar en utilisant ce logiciel

OpenCV

Cela a fonctionné, mais n'était pas une solution optimale pour nos besoins. Nos images sources (où nous recherchions le logo) étaient de taille fixe et ne contenaient que le logo. Pour cette raison, nous avons pu utiliser cvMatchShapes avec une bonne correspondance connue et comparer la valeur renvoyée pour juger une bonne correspondance.

4
sberry