Инициализация графа для алгоритма push-relabel

Учитывая алгоритм Push-Relabel Graph Cut, описанный в эта статья Я хочу выполнить сегментацию бинарного изображения. Мой вопрос касается инициализации графика.

При представлении изображения в виде графа с решетчатой ​​структурой (MRF) обычно формулируют задачу в соответствии со стандартной функцией энергии унарных и парных членов, как в разделе 3, уравнение 1 в эта статья, где унарный член представляет собой энергию данных, а парный член моделирует гладкость в каком-то районе.

Я изо всех сил пытаюсь установить связь между этой формулировкой оптимизации MRF и формулировкой алгоритма максимального потока в связанной статье. Насколько я понимаю, пропускная способность между соседними узлами может быть представлена ​​некоторой функцией расстояния (на основе значений пространственного расстояния и интенсивности), например, раздел 2, уравнение 7 в эта статья. Однако неясно, как можно включить в инициализацию графа предварительные знания, такие как начальные распределения для исходных точек.

На более высоком уровне, учитывая изображение с некоторыми помеченными исходными точками, относящимися к фону или классам объектов, как можно инициализировать потоковый граф, чтобы можно было использовать max-flow для выполнения двоичной сегментации?


person Jack H    schedule 09.06.2016    source источник


Ответы (1)


В графе есть вершина для каждого пикселя, но также есть вершина-источник и вершина-приемник, ни одна из которых не соответствует пикселю. Одна из возможных интерпретаций этих специальных вершин состоит в том, что источник представляет сегмент «переднего плана», а сток представляет сегмент «фона».

Пропускная способность дуги от источника до вершины пикселя представляет собой логарифмическую вероятность того, что этот пиксель находится на переднем плане. Пропускная способность дуги от вершины пикселя до стока представляет собой логарифмическую вероятность того, что этот пиксель находится на заднем плане. Емкость дуги между вершинами пикселей представляет собой логарифмическую вероятность того, что оба пикселя находятся на переднем плане или оба на заднем плане. Это убеждение должно быть выше, когда пиксели расположены близко друг к другу и когда пиксели имеют схожие цвета.

person David Eisenstat    schedule 09.06.2016
comment
Спасибо за ответ. Буду ли я прав, думая, что для условий логарифмического правдоподобия в соединениях источника и приемника можно вычислить выборочное среднее и ковариацию для помеченных точек и использовать полученные параметры в функции логарифмического правдоподобия нормального распределения? - person Jack H; 10.06.2016
comment
@VisionIncision Вы говорите о предыдущем дистрибутиве, для которого нет правильного выбора. Я действительно понятия не имею, работает ли это на практике. - person David Eisenstat; 10.06.2016