Чтобы использовать многомерный ввод, вам понадобятся многомерные нейроны (которые, я полагаю, не поддерживает ваш формализм). К сожалению, вы не предоставили никакой информации о своей сетевой структуре, что, я думаю, является вашим основным источником проблем и путаницы. Всякий раз, когда вы оцениваете представление объекта, вам нужно знать, как будет структурирован входной слой: если это нецелесообразно, вам, вероятно, потребуется другое представление.
Ваш многомерный вектор: сеть, принимающая на вход 1 изображение, имеет только 1 (!) входной узел, содержащий несколько векторов (строк соответственно). Это наихудшее представление ваших данных. Если мы:
- сгладить входную иерархию: мы получаем 1 входной нейрон для каждой строки.
- полностью сгладить входную иерархию: мы получаем 1 входной нейрон для каждого пикселя.
Подумайте обо всех трех подходах и о том, что они делают с вашими данными. Последний подход почти всегда так же плох, как и первый подход. Нейронные сети лучше всего работают с функциями. Функции — это не реструктуризация пикселей (ваших векторов-строк). Это должны быть МЕТА-данные, которые вы можете получить из пикселей: яркость, места, где мы переходим от обратного к белому, ограничительные рамки, края, формы, массы гравитации, ... есть множество вещей, которые можно выбрать в качестве функций на изображении. обработка. Вы должны подумать о своей проблеме и выбрать одну (или несколько).
В конце концов, когда вы спрашиваете о том, как «объединить строки в 1 вектор»: вы просто перефразируете «нахождение вектора признаков для всего изображения». Вы определенно не хотите «конкатенировать» свои векторы и передавать необработанные данные в сеть, вам нужно найти информацию, прежде чем использовать сеть. Это очень важно для предварительной обработки.
Для получения дополнительной информации о том, какие функции могут быть полезны для OCR, просто прочитайте некоторые статьи. Наиболее успешным сетевым банкоматом является Сверточная нейронная сеть. Отправной точкой для извлечения признаков темы является здесь.
person
runDOSrun
schedule
05.12.2014