Я работаю над заданием, и мы используем OneHotEncoder в scikit-learn, чтобы распечатать все категории. Вот образец данных и код, который я использовал для их преобразования:
grade sub_grade short_emp emp_length_num home_ownership term
0 B B2 0 11 RENT 36 months
1 C C4 1 1 RENT 60 months
2 C C5 0 11 RENT 36 months
3 C C1 0 11 RENT 36 months
4 A A4 0 4 RENT 36 months
5 E E1 0 10 RENT 36 months
Код:
from sklearn.preprocessing import OneHotEncoder
encoder = OneHotEncoder(categorical_features='all', handle_unknown='error', n_values='auto', sparse=True)
encoder.fit(lending_club)
Ошибка, которую я получаю, относится к столбцу терминов:
ValueError: could not convert string to float: ' 36 months'