В частности, областью, в которой находятся самоорганизующиеся карты, является размерность данных. Эта модель машинного обучения упорядочивает данные в карту на основе функций, которые можно извлечь несколькими способами. В частности, самоорганизующаяся карта имеет архитектуру нейронной сети (NN), в частности, автоэнкодер в фоновом режиме.

Чтобы быстро объяснить функциональность автоэнкодера, давайте просто представим сеть, которая имеет входные данные, извлекает ключевые функции в пространство с уменьшенным размером, а затем отображает их обратно в исходное большое пространство. Например, этот автоэнкодер обучается на наборе изображений, а эта сеть позволяет представлять сложные изображения простым способом.

Об этом, для самоорганизующейся карты в этой статье, я хочу, чтобы вы получили самое базовое интуитивное представление. Таким образом, в основном, перетаскивая узлы из некоторого векторного пространства в другое пространство, например, в 2 измерения, результирующая визуализация становится своего рода кластером.

В нашем примере давайте посмотрим на набор данных изображений, который начинается как случайно распределенный и выбранный. Мы попытаемся выполнить алгоритм самоорганизующейся карты с нарисованным от руки набором данных эмодзи, используя пакет MiniSom Python.

После этой простой настройки мы должны обучить нашу модель SOM и получить отчет о классификации, в котором рассказывается, что произойдет, если мы будем классифицировать наши наборы данных на основе результатов SOM.

Затем мы можем визуализировать наши данные на недавно созданной 2D-карте, где каждая точка данных представлена ​​своей меткой от 1 до 5, где метки обозначают улыбающиеся лица, грустные, злые, удивленные и какашки.

Затем мы можем сделать лучшую визуализацию, где можно увидеть упрощения, сделанные моделью в процессе уменьшения размерности. Предыдущая фигура перерисовывается в

после запуска следующего фрагмента кода.

Если вы внимательно посмотрите на недавно отрендеренные смайлики, ключевые характеристики были абстрагированы от исходных рисунков, и в целом изображения стали намного проще. Этот тип технологии обеспечивает простую обработку изображений, сжатие, чистое представление и реконструкцию изображений.

Дополнительные примеры и подробную реализацию можно найти в репозитории проекта.