web-dev-qa-db-fra.com

Extraire la boîte englobante et l'enregistrer en tant qu'image

Supposons que vous ayez l'image suivante:

Example:

Maintenant, je veux extraire chacune des lettres indépendantes en images individuelles. Actuellement, j'ai récupéré les contours et puis dessiné une boîte englobante, dans ce cas pour le caractère a:

Bounding box for the character 'a'

Après cela, je veux extraire chacune des cases (dans ce cas pour la lettre a) et l'enregistrer dans un fichier image.

Résultat attendu:

Result

Voici mon code jusqu'à présent:

import numpy as np
import cv2

im = cv2.imread('abcd.png')
im[im == 255] = 1
im[im == 0] = 255
im[im == 1] = 0
im2 = cv2.cvtColor(im,cv2.COLOR_BGR2GRAY)
ret,thresh = cv2.threshold(im2,127,255,0)
contours, hierarchy = cv2.findContours(thresh,cv2.RETR_TREE,cv2.CHAIN_APPROX_SIMPLE)

for i in range(0, len(contours)):
    if (i % 2 == 0):
       cnt = contours[i]
       #mask = np.zeros(im2.shape,np.uint8)
       #cv2.drawContours(mask,[cnt],0,255,-1)
       x,y,w,h = cv2.boundingRect(cnt)
       cv2.rectangle(im,(x,y),(x+w,y+h),(0,255,0),2)
       cv2.imshow('Features', im)
       cv2.imwrite(str(i)+'.png', im)

cv2.destroyAllWindows()

Merci d'avance.

Ce qui suit vous donnera une seule lettre

letter = im[y:y+h,x:x+w]
32
Andrey Kamaev

Voici une approche:

  • Convertir l'image en niveaux de gris
  • Le seuil d'Otsu pour obtenir une image binaire
  • Trouver les contours
  • Itérer à travers les contours et extraire le ROI à l'aide de la découpe Numpy

Après avoir trouvé les contours, nous utilisons cv2.boundingRect() pour obtenir les coordonnées du rectangle englobant pour chaque lettre.

x,y,w,h = cv2.boundingRect(c)

Pour extraire le ROI, nous utilisons le découpage Numpy

ROI = image[y:y+h, x:x+w]

Puisque nous avons les coordonnées du rectangle de délimitation, nous pouvons dessiner les boîtes de délimitation vertes

cv2.rectangle(copy,(x,y),(x+w,y+h),(36,255,12),2)

Voici les lettres détectées

enter image description here

Voici le ROI de chaque lettre enregistrée

enter image description here

import cv2

image = cv2.imread('1.png')
copy = image.copy()
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
thresh = cv2.threshold(gray,0,255,cv2.THRESH_OTSU + cv2.THRESH_BINARY)[1]

cnts = cv2.findContours(thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
cnts = cnts[0] if len(cnts) == 2 else cnts[1]

ROI_number = 0
for c in cnts:
    x,y,w,h = cv2.boundingRect(c)
    ROI = image[y:y+h, x:x+w]
    cv2.imwrite('ROI_{}.png'.format(ROI_number), ROI)
    cv2.rectangle(copy,(x,y),(x+w,y+h),(36,255,12),2)
    ROI_number += 1

cv2.imshow('thresh', thresh)
cv2.imshow('copy', copy)
cv2.waitKey()
0
nathancy