Проблемы создания PMML для 10-кратной перекрестной проверки Knime

Я работаю с KNIME и пытаюсь обучить свой алгоритм классификации Naive Bayes с тестовыми данными. Я попытался использовать 10-кратную перекрестную проверку, чтобы мои результаты были точными, но я не могу сгенерировать модель PMML: я продолжаю получать ошибку Конец цикла уже назначен (начальный узел имеет более одного конечного узла) . Это мой рабочий процесс KNIME:

снимок экрана рабочего процесса


person man like dave    schedule 26.03.2018    source источник


Ответы (1)


Точно, как говорится в сообщении об ошибке, у вас есть два конечных узла цикла (узлы PMML Ensemble Loop End и X-Aggregator), но только один запуск цикла (X -Разделитель).

Чего вы пытаетесь достичь? Обычно цель перекрестной проверки - оценить, насколько хорошо ваша прогностическая модель может работать с неизвестными данными. Если в конце вам нужна единственная обученная наивная байесовская модель, с помощью которой вы можете делать прогнозы, я думаю, вы хотите удалить конец цикла ансамбля PMML и вместо этого подключить нормализованный набор данных ко второму < strong> Naive Bayes Learner, настроенный так же, как и первый, а также для входа X-Partitioner. Результатом второго учащегося является модель, которую вы затем можете использовать для прогнозирования. Таким образом, второй обучающийся узел обучается на всем наборе данных для наиболее точной модели, в то время как исходный узел внутри цикла перекрестной проверки используется только для оценки того, насколько хорошей будет модель.

Если вы хотите убедиться, что оба учащихся используют одни и те же настройки, вы можете использовать переменные потока для передачи значений настроек от учащегося всего набора данных тому, кто находится внутри цикла:

  • Показать порты переменных потока на учащемся всего набора данных и в X-Partitioner и связать выходные данные первого с вводом второго.
  • На вкладке «Переменные потока» конфигурации учащегося всего набора данных введите имя в поле для каждого параметра, который вы хотите передать.
  • Запустите учащийся всего набора данных
  • На вкладке «Переменные потока» учащегося в цикле теперь вы должны иметь возможность выбирать имена переменных, которые вы создали, в раскрывающемся списке рядом с соответствующим параметром.
person nekomatic    schedule 26.03.2018