Реализация обнаружения рук с использованием OpenCV-Python с теоремой косинуса для задачи подсчета пальцев.

Увидев изображение выше, вы очень взволнованы тем, что реализовали его (как и я). Так что, не теряя слишком много времени, перейдем к коду.

OpenCV

OpenCV (библиотека компьютерного зрения с открытым исходным кодом) - это библиотека программного обеспечения для компьютерного зрения и машинного обучения с открытым исходным кодом. OpenCV был создан для обеспечения общей инфраструктуры для приложений компьютерного зрения и для ускорения использования машинного восприятия в коммерческих продуктах.

Импорт библиотек

  • cv2: opencv [pip install opencv]
  • numpy: для обработки массивов, а также для математики [pip install numpy]
import cv2 as cv
import numpy as np

Чтение изображения

img_path = "data/palm.jpg"
img = cv.imread(img_path)
cv.imshow('palm image',img)

SkinMask

Используется для выделения определенного цвета на изображении.

  • hsvim: изменить изображение BGR (синий, зеленый, красный) на HSV (оттенок, насыщенность, значение).
  • нижний: нижний диапазон цвета кожи при ВПГ.
  • верхний: верхний диапазон цвета кожи при ВПГ.
  • skinRegionHSV: обнаружение кожи в диапазоне значений нижнего и верхнего пикселей в цветовом пространстве HSV.
  • размыто: размытие изображения для улучшения маскировки.
  • обмолот: применение обмолота.
hsvim = cv.cvtColor(img, cv.COLOR_BGR2HSV)
lower = np.array([0, 48, 80], dtype = "uint8")
upper = np.array([20, 255, 255], dtype = "uint8")
skinRegionHSV = cv.inRange(hsvim, lower, upper)
blurred = cv.blur(skinRegionHSV, (2,2))
ret,thresh = cv.threshold(blurred,0,255,cv.THRESH_BINARY)
cv.imshow("thresh", thresh)

Контуры

Теперь поищем контуры на изображении.

contours, hierarchy = cv.findContours(thresh, cv.RETR_TREE, cv.CHAIN_APPROX_SIMPLE)
contours = max(contours, key=lambda x: cv.contourArea(x))
cv.drawContours(img, [contours], -1, (255,255,0), 2)
cv.imshow("contours", img)

Выпуклая оболочка

hull = cv.convexHull(contours)
cv.drawContours(img, [hull], -1, (0, 255, 255), 2)
cv.imshow("hull", img)

Дефекты выпуклости

Любое отклонение объекта от этого корпуса можно рассматривать как дефект выпуклости.

hull = cv.convexHull(contours, returnPoints=False)
defects = cv.convexityDefects(contours, hull)

Теорема косинусов

Теперь пришло время математики! Давайте разберемся с теоремой косинусов.

В тригонометрии закон косинусов связывает длины сторон треугольника с косинусом одного из его углов. Используя обозначения, как на рис. 1, закон косинусов гласит, что γ обозначает угол, заключенный между сторонами длин a и b и противоположный стороне длины c.

Формула

Видя эту формулу сейчас, мы понимаем, что если у нас есть; a, b и gama, тогда мы также находим c, а если бы у нас было; a, b, c, затем мы также находим гамму (наоборот)

Для нахождения гаммы используется эта формула:

Использование теоремы косинусов для распознавания пальцев

Извините! за этот грязный MS-Paint.

На рис. 2 я нарисовал сторону: a, b, c и угол: гамма. Теперь эта гамма всегда меньше 90 градусов, поэтому мы можем сказать: если гамма меньше 90 градусов или pi / 2, мы рассматриваем это как палец. .

Подсчет пальца

Примечание: если вы не знакомы с дефектами выпуклости, прочтите эту статью в документации opencv. нажмите здесь

Convexity Defects возвращает массив, каждая строка которого содержит следующие значения:

  • начальная точка
  • конечная точка
  • самая дальняя точка
  • приблизительное расстояние до самой дальней точки

По этой точке мы можем легко получить Стороны: a, b, c (см. КОД), а из теоремы косинусов мы также можем получить гамму или угол между двумя пальцами . Как вы читали ранее, если гамма меньше 90 градусов, мы обрабатываем это как палец. Зная гамму, мы просто рисуем круг с радиусом 4 в приблизительном расстоянии до самой дальней точки. И после того, как мы просто поместим текст в изображения, мы представим количество пальцев (cnt).

if defects is not None:
  cnt = 0
for i in range(defects.shape[0]):  # calculate the angle
  s, e, f, d = defects[i][0]
  start = tuple(contours[s][0])
  end = tuple(contours[e][0])
  far = tuple(contours[f][0])
  a = np.sqrt((end[0] - start[0]) ** 2 + (end[1] - start[1]) ** 2)
  b = np.sqrt((far[0] - start[0]) ** 2 + (far[1] - start[1]) ** 2)
  c = np.sqrt((end[0] - far[0]) ** 2 + (end[1] - far[1]) ** 2)
  angle = np.arccos((b ** 2 + c ** 2 - a ** 2) / (2 * b * c))  #      cosine theorem
  if angle <= np.pi / 2:  # angle less than 90 degree, treat as fingers
    cnt += 1
    cv.circle(img, far, 4, [0, 0, 255], -1)
if cnt > 0:
  cnt = cnt+1
cv.putText(img, str(cnt), (0, 50), cv.FONT_HERSHEY_SIMPLEX,1, (255, 0, 0) , 2, cv.LINE_AA)

Посмотрим на наш окончательный результат

cv.imshow('final_result',img)

Вы также можете сделать это для видео, просто вызвав cv.VideoCapture (). Если вам нужен код, вы можете получить его в моем GitHub: finger_counting_video.py