У меня есть список lists=[0,1,2,3,5,6,7]
. Порядок не является последовательным. У меня есть фреймворк pyspark с 9 столбцами.
+-------------------+--------+--------+--------+--------+--------+--------+---------------+-----+----+
| date|ftt (°c)|rtt (°c)|fbt (°c)|rbt (°c)|fmt (°c)|rmt (°c)|fmhhumidityunit|index|Diff|
+-------------------+--------+--------+--------+--------+--------+--------+---------------+-----+----+
|2019-02-01 05:29:47| NaN| NaN| NaN| NaN| NaN| NaN| NaN| 0| NaN|
|2019-02-01 05:29:17| NaN| NaN| NaN| NaN| NaN| NaN| NaN| 1| NaN |
Мне нужно добавить свои списки в виде столбца в существующий фрейм данных. Мои списки не в порядке, поэтому я не могу использовать udf. Есть ли способ сделать это? Пожалуйста, помогите мне, я хочу, чтобы это было так
+-------------------+--------+--------+--------+--------+--------+--------+---------------+-----+----+------+
| date|ftt (°c)|rtt (°c)|fbt (°c)|rbt (°c)|fmt (°c)|rmt (°c)|fmhhumidityunit|index|Diff|lists |
+-------------------+--------+--------+--------+--------+--------+--------+---------------+-----+----+-------+
|2019-02-01 05:29:47| NaN| NaN| NaN| NaN| NaN| NaN| NaN| 0| NaN|0 |
|2019-02-01 05:29:17| NaN| NaN| NaN| NaN| NaN| NaN| NaN| 1| NaN |1 |
0
, и могу ли я также сказать, что первый индекс вашего списка принадлежит первой строке с индексом0
? Я задаю этот вопрос, потому что фреймы данных pyspark не упорядочены (например, pandas), и для проведения такой операции требуется столбец, который позволяет вам упорядочить фрейм данных. - person cronoik   schedule 01.10.2019x[0][0],x[0][1],x[1]
. Это динамично ?. Решение должно работать для любого количества столбцов. длина списков равна строкам фрейма данных. - person user-2147482338   schedule 03.10.2019x[0][0],x[0][1],x[1]
будет работать для любого количества столбцов, верно? - person user-2147482338   schedule 03.10.2019