В настоящее время я работаю над проблемой распознавания рукописных цифр. Я обнаружил, что многие современные алгоритмы используют некоторые методы предварительной обработки для набора данных mnist, такие как выравнивание и дрожание (я не знаю, что такое «дрожание»). Я долго гуглил, но ничего не нашел о конкретных методах или алгоритмах, которые можно было бы использовать для устранения искажений mnist dateset. У кого-нибудь есть идеи, как решить эту проблему? Большое спасибо!
Исправление перекоса набора дат MNIST
Ответы (2)
Я долго и упорно гуглил, чтобы найти это, но так и не смог, пока не увидел эту статью:
Теоу, Лу-Нин и Киа-Фок Ло. «Надежные основанные на зрении функции и схемы классификации для автономного распознавания рукописных цифр». Распознавание образов 35.11 (2002): 2355-2364.
Прочтите раздел 4.2. Они описали процедуру изменения наклона своих изображений. Я не уверен, что это то же самое, что и удаление перекоса, но это самое близкое, что мне удалось найти.
Надеюсь, что это поможет, и буду признателен, если кто-нибудь подтвердит, является ли устранение наклона тем же, что и устранение перекоса.
Исправление перекоса взято из статьи Лекуна 1998 года [http://yann.lecun.com/exdb/publis/pdf/lecun-98.pdf].
Исправление перекоса вычисляет вторые моменты инерции пикселей (считая пиксель переднего плана за единицу, а пиксель фона за ноль) и сдвигает изображение, сдвигая линии по горизонтали так, чтобы главная ось была вертикальной.