Мой входной файл JSON
{
"Name": "Test",
"Mobile": 12345678,
"Boolean": true,
"Pets": ["Dog", "cat"],
"Address": {
"Permanent address": "USA",
"current Address": "AU"
}
}
Требование состоит в том, чтобы преобразовать вышеупомянутый многоуровневый JSON в фрейм данных с помощью pyspark.
Я пытался использовать код
path_to_input = "/FileStore/tables/sample_json_file2-6c20f.json"
df = spark.read.json(sc.wholeTextFiles(path_to_input).values())
df.show()
Я получил вывод как
+---------+-------+--------+----+----------+
| Address|Boolean| Mobile|Name| Pets|
+---------+-------+--------+----+----------+
|[USA, AU]| true|12345678|Test|[Dog, cat]|
+---------+-------+--------+----+----------+
В полях адреса и домашних животных я получаю два значения в одних и тех же столбцах. Это не должно быть похоже на массив. Я должен получить адрес Address_Permanent как USA, Address_current Address как AU.