Я работал над Linear Regression
моделированием в PySpark
и сомневаюсь, что смогу его переоценить. Данные, которые у меня есть, имеют categorical features
. Я просмотрел документацию по PySpark
, и пример для Linear Regression
показывает следующее:
model = LinearRegressionWithSGD.train(parsedData)
Он не показывает, как передать categorical features
в Linear Regression
. Я работал над Random Forest
в PySpark
, прежде чем я сначала encoded
categorical features
, а затем передал эти функции в модель, поскольку Random Forest
предоставляет parameter
для указания categorical features
. Linear Regression
не показывает такой параметр в документации.
Может ли кто-нибудь помочь мне, предоставив мне способ перейти от categorical feature
к моделированию Linear Regression
в PySpark
MLlib