Facenet - это модель глубокого обучения для распознавания лиц. Он обучен извлекать признаки, то есть представлять изображение вектором фиксированной длины, называемым встраиванием. После обучения для каждого данного изображения мы берем выходные данные второго последнего слоя в качестве его вектора признаков. После этого мы можем выполнить проверку (чтобы определить, принадлежат ли два изображения одного и того же человека) на основе характеристик и некоторой функции расстояния (например, евклидова расстояния).
Триплетная потеря - это функция потерь, которая, по сути, гласит, что расстояние между векторами признаков одного и того же человека должно быть небольшим, а расстояние между разными людьми должно быть большим.
Мой вопрос: есть ли способ смешать разные наборы встраивания из разных сверточных моделей? Например, обучите 3 разные модели (модель Resnet, Inception и VGG) с триплетными потерями, а затем смешайте 3 128-мерных встраивания для создания нового мета-встраивания для повышения точности проверки лица. Как можно смешивать эти наборы для вложения?