Как выбираются значения привязки в yolov2-tiny.cfg?

В yolov2-tiny.cfg якоря имеют следующий вид: -

anchors = 0.57273, 0.677385, 1.87446, 2.06253, 3.33843, 5.47434, 7.88282, 3.52778, 9.77052, 9.16828

Какие это ценности? Это высота, ширина или что-то в этом роде? Кто-нибудь может мне это объяснить.


person Ashna Eldho    schedule 21.03.2019    source источник


Ответы (1)


Это значения ширины и высоты. Если вы сгруппируете эти числа, они сформируют наборы ширины и высоты, как это

(0.57273, 0.677385), (1.87446, 2.06253), (3.33843, 5.47434), (7.88282, 3.52778), (9.77052, 9.16828)

Как видите, имеется 5 круглых скобок, что означает, что для каждой сетки есть 5 разных якорных ящиков. Например, Yolo делит входное изображение на сетку 13x13, поэтому каждая сетка будет иметь 5 соответствующих якорных ящиков. Эти значения представляют собой просто начальные значения или значения по умолчанию, установленные автором, позже размер окна будет изменен на ближайший прогнозируемый объект. Таким образом, сеть будет корректировать размер ближайшего якорного бокса к размеру предсказанного объекта.

Почему 5? В случае Yolo V2 он имеет 5 якорных ящиков, в то время как Yolo V3 имеет 9 якорных ящиков для более высоких долговых обязательств.

Как создать якорные блоки для вашего пользовательского набора данных? Вы должны использовать кластеризацию K-средних для создания якорей. Например, используйте репо Алексея: https://github.com/AlexeyAB/darknet/blob/master/scripts/gen_anchors.py

Для более подробного обсуждения обратитесь к ссылке на github: https://github.com/pjreddie/darknet/issues/568
Для получения дополнительных сведений о блоке привязки и кластеризации K-средних перейдите к разделу 3 https://medium.com/@vivek.yadav/part-1-generating-anchor-box-for-yolo-like-network-for-vehicle-detection-using-kitti-dataset-b2fe033e5807

person gameon67    schedule 21.03.2019