Weka показывает странные результаты для классификации - вопросительные знаки?

Я пытаюсь использовать алгоритм ZeroR в Weka, чтобы добиться базовой производительности для моей задачи классификации. Однако Weka показывает странные результаты для точности и F-меры, показывает вопросительный знак '?' вместо любого числа. Кто-нибудь знает, как я могу это исправить?

=== Classifier model (full training set) ===

ZeroR predicts class value: label 1

Time taken to build model: 0 seconds

=== Stratified cross-validation ===
=== Summary ===

Correctly Classified Instances         431               53.607  %
Incorrectly Classified Instances       373               46.393  %
Kappa statistic                          0     
Mean absolute error                      0.4974
Root mean squared error                  0.4987
Relative absolute error                100      %
Root relative squared error            100      %
Total Number of Instances              804     

=== Detailed Accuracy By Class ===

                 TP Rate  FP Rate  Precision  Recall   F-Measure  MCC      ROC Area  PRC Area  Class
                 0.000    0.000    ?          0.000    ?          ?        0.488     0.457     label 0
                 1.000    1.000    0.536      1.000    0.698      ?        0.488     0.530     label 1
Weighted Avg.    0.536    0.536    ?          0.536    ?          ?        0.488     0.496     

=== Confusion Matrix ===

   a   b   <-- classified as
   0 373 |   a = label 0
   0 431 |   b = label 1

person Perl    schedule 27.04.2019    source источник


Ответы (1)


Это не так. Обратите внимание, что у вас нет случаев, классифицированных как «а», поэтому точность (и т. д.) не определена для «а». Очевидно, что Weka распространяет неисчислимые значения (как это делает Excel), поэтому общая точность также не рассчитывается.

Ваша настоящая проблема здесь в том, что у вас есть модель, которая классифицирует все как «b», что вряд ли будет полезно. Но это ZeroR, так что это только ваша отправная точка.

person zbicyclist    schedule 29.04.2019
comment
спасибо @zbicyclist за ваш отзыв. Да, я понимаю тот факт, что точность для a неопределима, и Weka распространила это на общую точность, но если мы по какой-то причине хотим полагаться на вывод ZeroR (отчетность результатов), можем ли мы считать, что общая точность равна 'b ' ?? - person Perl; 29.04.2019
comment
Да. Точность определяется следующим образом: сколько из тех случаев, которые мы предсказываем как X, являются X? Или True Positive / (True Positive + False Positive). Итак, в данном случае это 431/(431 + 373) = 0,536. - person zbicyclist; 30.04.2019