В официальной документации Spark,
VectorSlicer — это преобразователь, который берет вектор признаков и выводит новый вектор признаков с подмассивом исходных признаков. Это полезно для извлечения признаков из векторного столбца.
Выбирает ли это важные функции из набора функций?
Если это так, как это сделать без упоминания зависимой переменной?
Я пытаюсь выполнить кластеризацию данных, и мне нужны важные функции, которые будут лучше способствовать кластеризации. Могу ли я использовать VectorSlicer
для этого?