Я работаю с KNIME и пытаюсь обучить свой алгоритм классификации Naive Bayes с тестовыми данными. Я попытался использовать 10-кратную перекрестную проверку, чтобы мои результаты были точными, но я не могу сгенерировать модель PMML: я продолжаю получать ошибку Конец цикла уже назначен (начальный узел имеет более одного конечного узла) сильный>. Это мой рабочий процесс KNIME:
Проблемы создания PMML для 10-кратной перекрестной проверки Knime
Ответы (1)
Точно, как говорится в сообщении об ошибке, у вас есть два конечных узла цикла (узлы PMML Ensemble Loop End и X-Aggregator), но только один запуск цикла (X -Разделитель).
Чего вы пытаетесь достичь? Обычно цель перекрестной проверки - оценить, насколько хорошо ваша прогностическая модель может работать с неизвестными данными. Если в конце вам нужна единственная обученная наивная байесовская модель, с помощью которой вы можете делать прогнозы, я думаю, вы хотите удалить конец цикла ансамбля PMML и вместо этого подключить нормализованный набор данных ко второму < strong> Naive Bayes Learner, настроенный так же, как и первый, а также для входа X-Partitioner. Результатом второго учащегося является модель, которую вы затем можете использовать для прогнозирования. Таким образом, второй обучающийся узел обучается на всем наборе данных для наиболее точной модели, в то время как исходный узел внутри цикла перекрестной проверки используется только для оценки того, насколько хорошей будет модель.
Если вы хотите убедиться, что оба учащихся используют одни и те же настройки, вы можете использовать переменные потока для передачи значений настроек от учащегося всего набора данных тому, кто находится внутри цикла:
- Показать порты переменных потока на учащемся всего набора данных и в X-Partitioner и связать выходные данные первого с вводом второго.
- На вкладке «Переменные потока» конфигурации учащегося всего набора данных введите имя в поле для каждого параметра, который вы хотите передать.
- Запустите учащийся всего набора данных
- На вкладке «Переменные потока» учащегося в цикле теперь вы должны иметь возможность выбирать имена переменных, которые вы создали, в раскрывающемся списке рядом с соответствующим параметром.