Я знаю, что PCA не сообщает вам, какие функции набора данных являются наиболее важными, но какие комбинации функций сохраняют наибольшую вариативность.
Как вы могли бы использовать тот факт, что PCA вращает набор данных таким образом, чтобы он имел наибольшую дисперсию по первому измерению, второму по второму и так далее, чтобы уменьшить размерность набора данных?
Я имею в виду, более подробно, как первые N собственных векторов используются для преобразования векторов признаков в представление более низкой размерности, которое сохраняет большую часть дисперсии?