Реализация обнаружения рук с использованием OpenCV-Python с теоремой косинуса для задачи подсчета пальцев.

Увидев изображение выше, вы очень взволнованы тем, что реализовали его (как и я). Так что, не теряя слишком много времени, перейдем к коду.
OpenCV
OpenCV (библиотека компьютерного зрения с открытым исходным кодом) - это библиотека программного обеспечения для компьютерного зрения и машинного обучения с открытым исходным кодом. OpenCV был создан для обеспечения общей инфраструктуры для приложений компьютерного зрения и для ускорения использования машинного восприятия в коммерческих продуктах.
Импорт библиотек
- cv2: opencv [pip install opencv]
- numpy: для обработки массивов, а также для математики [pip install numpy]
import cv2 as cv import numpy as np
Чтение изображения
img_path = "data/palm.jpg"
img = cv.imread(img_path)
cv.imshow('palm image',img)

SkinMask
Используется для выделения определенного цвета на изображении.
- hsvim: изменить изображение BGR (синий, зеленый, красный) на HSV (оттенок, насыщенность, значение).
- нижний: нижний диапазон цвета кожи при ВПГ.
- верхний: верхний диапазон цвета кожи при ВПГ.
- skinRegionHSV: обнаружение кожи в диапазоне значений нижнего и верхнего пикселей в цветовом пространстве HSV.
- размыто: размытие изображения для улучшения маскировки.
- обмолот: применение обмолота.
hsvim = cv.cvtColor(img, cv.COLOR_BGR2HSV)
lower = np.array([0, 48, 80], dtype = "uint8")
upper = np.array([20, 255, 255], dtype = "uint8")
skinRegionHSV = cv.inRange(hsvim, lower, upper)
blurred = cv.blur(skinRegionHSV, (2,2))
ret,thresh = cv.threshold(blurred,0,255,cv.THRESH_BINARY)
cv.imshow("thresh", thresh)

Контуры
Теперь поищем контуры на изображении.
contours, hierarchy = cv.findContours(thresh, cv.RETR_TREE, cv.CHAIN_APPROX_SIMPLE)
contours = max(contours, key=lambda x: cv.contourArea(x))
cv.drawContours(img, [contours], -1, (255,255,0), 2)
cv.imshow("contours", img)

Выпуклая оболочка
hull = cv.convexHull(contours)
cv.drawContours(img, [hull], -1, (0, 255, 255), 2)
cv.imshow("hull", img)

Дефекты выпуклости
Любое отклонение объекта от этого корпуса можно рассматривать как дефект выпуклости.
hull = cv.convexHull(contours, returnPoints=False) defects = cv.convexityDefects(contours, hull)

Теорема косинусов
Теперь пришло время математики! Давайте разберемся с теоремой косинусов.
В тригонометрии закон косинусов связывает длины сторон треугольника с косинусом одного из его углов. Используя обозначения, как на рис. 1, закон косинусов гласит, что γ обозначает угол, заключенный между сторонами длин a и b и противоположный стороне длины c.

Формула

Видя эту формулу сейчас, мы понимаем, что если у нас есть; a, b и gama, тогда мы также находим c, а если бы у нас было; a, b, c, затем мы также находим гамму (наоборот)
Для нахождения гаммы используется эта формула:

Использование теоремы косинусов для распознавания пальцев

Извините! за этот грязный MS-Paint.
На рис. 2 я нарисовал сторону: a, b, c и угол: гамма. Теперь эта гамма всегда меньше 90 градусов, поэтому мы можем сказать: если гамма меньше 90 градусов или pi / 2, мы рассматриваем это как палец. .
Подсчет пальца
Примечание: если вы не знакомы с дефектами выпуклости, прочтите эту статью в документации opencv. нажмите здесь
Convexity Defects возвращает массив, каждая строка которого содержит следующие значения:
- начальная точка
- конечная точка
- самая дальняя точка
- приблизительное расстояние до самой дальней точки
По этой точке мы можем легко получить Стороны: a, b, c (см. КОД), а из теоремы косинусов мы также можем получить гамму или угол между двумя пальцами . Как вы читали ранее, если гамма меньше 90 градусов, мы обрабатываем это как палец. Зная гамму, мы просто рисуем круг с радиусом 4 в приблизительном расстоянии до самой дальней точки. И после того, как мы просто поместим текст в изображения, мы представим количество пальцев (cnt).
if defects is not None:
cnt = 0
for i in range(defects.shape[0]): # calculate the angle
s, e, f, d = defects[i][0]
start = tuple(contours[s][0])
end = tuple(contours[e][0])
far = tuple(contours[f][0])
a = np.sqrt((end[0] - start[0]) ** 2 + (end[1] - start[1]) ** 2)
b = np.sqrt((far[0] - start[0]) ** 2 + (far[1] - start[1]) ** 2)
c = np.sqrt((end[0] - far[0]) ** 2 + (end[1] - far[1]) ** 2)
angle = np.arccos((b ** 2 + c ** 2 - a ** 2) / (2 * b * c)) # cosine theorem
if angle <= np.pi / 2: # angle less than 90 degree, treat as fingers
cnt += 1
cv.circle(img, far, 4, [0, 0, 255], -1)
if cnt > 0:
cnt = cnt+1
cv.putText(img, str(cnt), (0, 50), cv.FONT_HERSHEY_SIMPLEX,1, (255, 0, 0) , 2, cv.LINE_AA)
Посмотрим на наш окончательный результат
cv.imshow('final_result',img)

Вы также можете сделать это для видео, просто вызвав cv.VideoCapture (). Если вам нужен код, вы можете получить его в моем GitHub: finger_counting_video.py