Учитывая следующий прогнозируемый ранжированный список документов:
query1_predicted = [1381, 1637, 646, 1623, 774, 1764, 92, 12, 642, 463, 613, ...]
и этот отмеченный вручную лучший выбор:
query1_manual = 646
Есть ли какая-либо подходящая метрика из поиска информации, уже реализованная в python, для ранжирования этого результата?
Я не думаю, что NDCG работает для меня, потому что мне не хватает истинного и полностью ранжированного список документов. Я предполагаю, что отзыв, точность, F-оценка и MAP также не будут работать, пока у меня нет полного списка ранжированных вручную результатов для каждого запроса, указывающих на релевантность документа.
Кстати: длина прогнозируемого списка равна общему количеству документов в моей коллекции:
len(query1_predicted) = len(documents)
Спасибо за помощь в продвижении!