Лучшие улучшения ImageMagick для удобочитаемости чисел (с Tesseract)

Я использую ImageMagick для преобразования оцифрованного файла PDF в TIFF. Я использую Tesseract для сканирования небольшой части этого документа, которая представляет собой число. Мои оцифрованные документы имеют плохое разрешение, и иногда tesseract не может прочитать правильный номер. Например, он гласит: 5550002845 для номера, который вы видите на картинке.

введите здесь описание изображения

Это изображение было извлечено из PDF с помощью следующей команды:

convert -quality 100 -density 300 temp.pdf -depth 8 -colorspace gray +matte +contrast +contrast temp.tiff

Есть ли что-нибудь лучшее, что я могу сделать, чтобы улучшить качество изображения (обнаружения Tesseract)?

С Уважением

Vincent Roye 20.12.2013 источник

Ответы (1)

arrow_upward
0
arrow_downward

-noise 7 сделал свое дело для этого

Vincent Roye 20.12.2013

Лучшие улучшения ImageMagick для удобочитаемости чисел (с Tesseract)

Ответы (1)

Похожие вопросы