Гистограмма ориентированных градиентов - объяснение

Как объяснить непрофессионалу алгоритм Гистограммы ориентированных градиентов?


comment
Интересно, должен ли этот вопрос принадлежать DSP, CS?   -  person morynicz    schedule 31.10.2013
comment
@morynicz Это тема обработки изображений   -  person Jeru Luke    schedule 16.12.2016


Ответы (2)


Нахождение «градиента» пикселя заключается в нахождении края, проходящего через этот пиксель, ориентации этого края и степени видимости этого края.

Поскольку мы принимаем во внимание направление краев, мы говорим «ориентированные градиенты».

«Гистограмма» подсчитывает, сколько пикселей имеет край с определенной ориентацией. Пиксели с видимыми краями имеют большее значение, чем пиксели с размытыми краями.

Например, если у нас есть квадрат на изображении, мы увидим, что HOG имеет много пикселей, подсчитанных в вертикальном направлении, и такое же количество пикселей, подсчитанных в горизонтальном направлении, пиксели не будут подсчитаны в диагональных направлениях. Если бы у нас был прямоугольник, лежащий плоско, в горизонтальном направлении было бы больше пикселей, чем в вертикальном, потому что горизонтальные края длиннее. Если бы у нас был ромб, мы бы считали пиксели с диагональными краями. Таким образом, вы можете распознавать формы, просто сравнивая гистограммы (сколько пикселей имеют ребра в каждом направлении).

Если нам нужно найти квадраты (или лица, или людей, или что-то еще) определенного размера, мы делим изображение на блоки размера квадратов, которые мы хотим найти, и сравниваем HOG, который мы получаем, с HOG предмета, который мы хотим найти. мы ищем.

person user2518618    schedule 30.01.2014