У меня есть архитектура CNN, которую я обучаю распознавать некоторые объекты, которые мне нужно в конечном итоге использовать в реальном времени, а затем использовать вывод обнаруженных объектов для дальнейшей работы. У меня есть два вопроса по этому поводу, на которые мне нужно ответить, чтобы оценить следующий шаг, который мне нужно сделать:
По мере того, как я больше изучал CNN, я обнаружил, что существуют разные типы CNN, такие как более быстрая CNN. Поэтому я хочу знать, какой тип архитектуры использует Keras при использовании своих функций conv2d (ниже я приведу код для своей архитектуры CNN)
Созданная модель помогает мне определить, находится ли объект, который я ищу, на изображении или нет, но я также хочу найти область предсказания на изображении. Возможно ли это с использованием той же архитектуры или мне нужно использовать что-то еще, например YOLO?
classifier = Sequential()
classifier.add(Conv2D(32, (3, 3), input_shape= (128, 128, 3), activation = 'relu' ))
classifier.add(MaxPooling2D(pool_size = (2, 2)))
classifier.add(Conv2D(64, (3, 3), activation = 'relu' ))
classifier.add(MaxPooling2D(pool_size = (2, 2)))
classifier.add(Conv2D(128, (3, 3), activation = 'relu' ))
classifier.add(MaxPooling2D(pool_size = (2, 2)))
classifier.add(Flatten())
classifier.add(Dense(units = 128, activation = 'relu'))
classifier.add(Dense(units = 1, activation = 'sigmoid'))
classifier.compile(optimizer = 'adam', loss = 'binary_crossentropy', metrics = ['accuracy'])
РЕДАКТИРОВАТЬ: Чтобы быть более конкретным, я хочу знать, предоставляет ли то, что использует тензорный поток или какой-либо бэкэнд-керас, базовую CNN, и то, как мы определяем архитектуру, определяет, какой тип CNN мы используем, например региональный CNN, быстрый CNN или быстрее Си-Эн-Эн? или это что-то определенное на другом уровне?
Надеюсь, я ясно выразился.