В настоящее время я читаю статью «FlowNet: изучение оптического потока с помощью сверточных сетей», и у меня возникают проблемы с пониманием уровня корреляции.
Кажется, я не могу найти никакого объяснения в Google, поэтому я подумал, что должен спросить ее:
Когда в документе говорится о сравнении каждого патча из f_1 с каждым патчем из f_2, где f_1 и f_2 – карты объектов размерности whc, что они подразумевают под патчем? Мы говорим о фрагменте функций из карты объектов или фрагменте пикселей из одного из исходных изображений?
что такое x_1 и x_2? Являются ли они пикселем функции (1 * 1 * c) на картах функций? они являются координатными значениями?
Что именно означает f_1(x_1 + o)?
Большое спасибо!