Я пытаюсь запустить следующий код в блоках данных, чтобы вызвать сеанс искры и использовать его для открытия файла csv:
spark
fireServiceCallsDF = spark.read.csv('/mnt/sf_open_data/fire_dept_calls_for_service/Fire_Department_Calls_for_Service.csv', header=True, inferSchema=True)
И я получаю следующую ошибку:
NameError:name 'spark' is not defined
Есть идеи, что может быть не так?
Я также пробовал запустить:
from pyspark.sql import SparkSession
Но получил в ответ следующее:
ImportError: cannot import name SparkSession
Если это помогает, я пытаюсь следовать следующему примеру (вы поймете лучше, если посмотрите его с 17:30): https://www.youtube.com/watch?v=K14plpZgy_c&list=PLIxzgeMkSrQ-2Uizm4l0HjNSSjX2Nxgqq