Привет, у меня есть дата в следующем формате [[a,b,c],[d,e,f],.........] в файле csv.
Это массив 3x100. Пожалуйста, предложите мне, как загрузить данные в массив numpy, и я также хочу выполнить одно горячее кодирование.
Привет, у меня есть дата в следующем формате [[a,b,c],[d,e,f],.........] в файле csv.
Это массив 3x100. Пожалуйста, предложите мне, как загрузить данные в массив numpy, и я также хочу выполнить одно горячее кодирование.
Вы не предоставили общий доступ к файлу csv правильно, вот мое лучшее предположение
сначала прочитайте данные из файла, используя простую операцию чтения файла, затем используйте модуль json, чтобы преобразовать его в список
import json
a= '[[1,11,1],[7,7,77],[5,6,7]]'
a = json.loads(a)
это даст вам список списка как [[1, 11, 1], [7, 7, 77], [5, 6, 7]]
преобразовать его в фрейм данных python
import pandas as pd
df = pd.DataFrame.from_records(a, columns=['col1','col2','col3'])
Вы можете напрямую использовать функцию pandas Categorical
для создания одной горячей кодировки ex
df['col2'] = pd.Categorical(df['col2'])