Предварительная обработка изображений и подключенные компоненты

У меня есть изображение комикса, и я хочу извлечь из него панели и текстовые выноски. Для этой цели я использую алгоритм подключенных компонентов "bwconncomp". Зная, что "bwconncomp" требует бинарного изображения в качестве аргумента, я использую "im2bw" для бинаризации моего изображения с последующей некоторой морфологической фильтрацией.

Ibw = im2bw(I,graythresh(I)); % also tried the default threshold along with all values in the      % range [0 1]
Imr = bwmorph(Ibw,'skel'); % also tried 'close' and 'clean' 

Icc = bwareaopen(Imr,100); 

Проблема в том, что я получаю резкое изменение количества обнаруженных связанных компонентов при изменении порога бинаризации и некоторых изменений при морфологической операции. Ни одна из комбинаций, которые я пробовал, не дала мне всех доступных основных объектов изображения, всегда чего-то не хватало.

Может ли кто-нибудь помочь мне с этим?


person user2217303    schedule 11.08.2014    source источник
comment
Ну это БОЛЬШАЯ проблема. Невозможно создать метод THE THRESHOLD для результата, который вы хотите, чтобы он всегда работал, особенно если вы работаете с комиксами, где, я думаю, изображения сильно меняются от квадрата к квадрату. Я бы посоветовал сначала найти квадраты и разделить каждую панель. Затем выполните три попытки с высоким пороговым значением (поскольку я полагаю, что воздушные шары белые) или попробуйте найти круглые объекты и белые объекты вместе. Другой вариант - внедрить также OCR и найти белые области, где текст... Ваш вопрос может быть программным обеспечением GOOGLE, если он правильно закодирован, на него нелегко ответить.   -  person Ander Biguri    schedule 11.08.2014
comment
Я предлагаю вам разбить проблему на маленькие задачи и попытаться решить их одну за другой. Вы сможете получить лучшие результаты и лучшие ответы в SO.   -  person Ander Biguri    schedule 11.08.2014
comment
Пожалуйста, опубликуйте пример изображения того, что вы пытаетесь сегментировать. Это может помочь нам найти решение   -  person rayryeng    schedule 11.08.2014
comment
Мне нужно 10 репутаций, чтобы иметь возможность опубликовать изображение.. если у вас есть другой способ поделиться им, я не против   -  person user2217303    schedule 11.08.2014


Ответы (1)


Вы можете попробовать обнаружить текст, а не просто бинаризировать изображение. Если у вас установлена ​​последняя версия MATLAB с набором инструментов Computer Vision System Toolbox, вы можете попробовать это пример обнаружения текста.

person Dima    schedule 11.08.2014