Я пытаюсь десериализовать кадр данных искры в другой кадр данных, как ожидается ниже.
Существующие данные кадра данных:
Существующая схема Dataframe:
Ожидаемый кадр данных:
Может ли кто-нибудь помочь мне в этом?
Я пытаюсь десериализовать кадр данных искры в другой кадр данных, как ожидается ниже.
Существующие данные кадра данных:
Существующая схема Dataframe:
Ожидаемый кадр данных:
Может ли кто-нибудь помочь мне в этом?
Вы можете использовать explode для этого.
from pyspark.sql.functions import explode
df.withColumn("ns2:fileName", explode(df.ns2:fileName))
ИЗМЕНИТЬ
df.withColumn("result", explode(zip($"ns2:fileName", $"ns2:alias"))).select(
$"result._1".alias("ns2:fileName"), $"result._2".alias("ns2:alias"))
Возможный дубликат.