В настоящее время я работаю над некоторыми научными данными и пытаюсь выполнить задачу кластеризации, но получаю ошибку значения из-за формата данных. Это два Pandas DataFrames в [170 строк x 7 столбцов].
Я пробовал переносить данные, форматировать в виде списка, а также в виде массива numpy. Формат, который я показываю в коде, взят из решения, найденного здесь: ValueError: невозможно скопировать последовательность с размером 5 на ось массива с размером 2
#x is the y distance
x = np.empty(7, dtype = object)
x[:] = [distance_lC, distance_fC]
#y is the speed.
y = np.empty(7, dtype = object)
y[:] = [speed_lC, speed_fC]
cell_kmeans = KMeans(n_clusters = 4).fit_predict(y)
fig = plt.figure()
ax = fig.add_subplot(1,1,1)
ax.scatterplot(cell_kmeans)
plt.show()
На выходе должен выдать кластер. Но у меня есть следующая ошибка значения: «ValueError: установка элемента массива с последовательностью».
y[:] = [speed_lC, speed_fC]
, вашy
превратится в список, и scikit это не понравится! не могли бы вы рассказать нам, что такоеspeed_lC, speed_fC
? (используйтеtype(speed_lC)
) - person lorenzori   schedule 12.07.2019type
выходы:pandas.core.frame.DataFrame
- person Hugobp   schedule 13.07.2019