Классификация с несколькими функциями?

У меня есть:

1) 2 группы испытуемых (контроль и больные раком)

2) группа признаков, для каждого из них.

Я хочу найти функцию или комбинацию каких функций лучше всего различать две группы.

Я начал с оценки AUC, затем с некоторой кластеризацией k означает, но я не знаю, как комбинировать признаки для классификации.

Спасибо


person Inchan    schedule 19.01.2019    source источник


Ответы (1)


Я предлагаю вам использовать какой-либо метод оценки важности функции. Существует множество различных способов проверки важности функций. Во-первых, на мой взгляд, самым простым является классификатор Random Forest. Эта модель имеет «встроенную» оценку важности функции во время обучения на основе случайной ошибки. Древовидные классификаторы должны оценивать прирост информации после получения значения признака в процессе обучения.

Вы также можете проверить важность функции, проверив оценку модели, изменив набор данных, то есть используя стратегию обратного исключения.

Вы также можете использовать PCA или статистические тесты. Наконец, вы также можете искать зависимости между функциями, которые нужно удалить из ваших данных, которые не предоставляют достаточно информации.

person podludek    schedule 29.01.2019