Понимание максимальных обнаружений при оценке COCO

Я начал использовать cocoapi для оценки модели, обученной с помощью API обнаружения объектов. После прочтения различных источников, которые объясняют среднюю точность (MAP) и отзыв, я смущен параметром «максимальное обнаружение», используемым в cocoapi.

Насколько я понял (например, здесь, здесь или здесь), рассчитывается MAP путем вычисления точности и отзыва для различных пороговых значений оценки модели. Это дает кривую точности-отзыва, и mAP рассчитывается как приближение к площади под этой кривой. Или, иначе говоря, как среднее значение максимальной точности в определенных диапазонах отзыва (0: 0,1: 1).

Тем не менее, cocoapi, кажется, вычисляет точность и отзыв для заданного количества максимальных обнаружений (maxDet) с наивысшими баллами. И оттуда получите кривую точности-отзыва для maxDets = 1, 10, 100. Почему это хорошая метрика, поскольку она явно не совпадает с указанным выше (потенциально исключает точки данных)?

В моем примере у меня ~ 3000 объектов на изображение. Оценка результата с помощью cocoapi плохо отзывается, потому что ограничивает количество обнаруженных объектов до 100.

В целях тестирования я использую набор оценочных данных как основную истину и обнаруженные объекты (с некоторыми искусственными оценками). Я ожидал, что точность и отзывчивость будут довольно хорошими, что и происходит на самом деле. Но как только я загружаю более 100 объектов, точность и запоминание падают с увеличением числа «обнаруженных объектов». Хотя все они «правильные»! Как это имеет смысл?


person mincos    schedule 16.10.2018    source источник


Ответы (2)


Вы можете изменить параметр maxDets и определить новый метод экземпляра summarize().

Создадим объект COCOeval:

cocoEval = COCOeval(cocoGt,cocoDt,annType)
cocoEval.params.maxDets = [200]
cocoEval.params.imgIds  = imgIdsDt
cocoEval.evaluate()
cocoEval.accumulate()
cocoEval.summarize_2() # instead of calling cocoEval.summarize()

Теперь определите метод summarize_2() в модуле cocoeval.py следующим образом:

def summarize_2(self):
    # Copy everything from `summarize` method here except
    # the function `_summarizeDets()`.
    def _summarizeDets():
        stats = np.zeros((12,))
        stats[0] = _summarize(1, maxDets=self.params.maxDets[0])
        stats[1] = _summarize(1, iouThr=.5, maxDets=self.params.maxDets[0])
        stats[2] = _summarize(1, iouThr=.75, maxDets=self.params.maxDets[0])
        stats[3] = _summarize(1, areaRng='small', maxDets=self.params.maxDets[0])
        stats[4] = _summarize(1, areaRng='medium', maxDets=self.params.maxDets[0])
        stats[5] = _summarize(1, areaRng='large', maxDets=self.params.maxDets[0])
        stats[6] = _summarize(0, maxDets=self.params.maxDets[0])
        stats[9] = _summarize(0, areaRng='small', maxDets=self.params.maxDets[0])
        stats[10] = _summarize(0, areaRng='medium', maxDets=self.params.maxDets[0])
        stats[11] = _summarize(0, areaRng='large', maxDets=self.params.maxDets[0])
        return stats
    # Copy other things which are left from `summarize()` here.

Если вы запустите вышеуказанный метод над своим набором данных, вы получите результат, подобный этому:

 Average Precision  (AP) @[ IoU=0.50:0.95 | area=   all | maxDets=200 ] = 0.507
 Average Precision  (AP) @[ IoU=0.50      | area=   all | maxDets=200 ] = 0.699
 Average Precision  (AP) @[ IoU=0.75      | area=   all | maxDets=200 ] = 0.575
 Average Precision  (AP) @[ IoU=0.50:0.95 | area= small | maxDets=200 ] = 0.586
 Average Precision  (AP) @[ IoU=0.50:0.95 | area=medium | maxDets=200 ] = 0.519
 Average Precision  (AP) @[ IoU=0.50:0.95 | area= large | maxDets=200 ] = 0.501
 Average Recall     (AR) @[ IoU=0.50:0.95 | area=   all | maxDets=200 ] = 0.598
 Average Recall     (AR) @[ IoU=0.50:0.95 | area= small | maxDets=200 ] = 0.640
 Average Recall     (AR) @[ IoU=0.50:0.95 | area=medium | maxDets=200 ] = 0.566
 Average Recall     (AR) @[ IoU=0.50:0.95 | area= large | maxDets=200 ] = 0.564
person ashkan    schedule 14.05.2019

Я пришел к выводу, что именно так cocoapi определяет свою метрику. Это, вероятно, имеет смысл в их контексте, но я также могу определить свое собственное (что я и сделал), основываясь на статьях, которые я прочитал и дал ссылки выше.

person mincos    schedule 02.11.2018