Я настроил свой PyCharm для связи с моей локальной установкой искры в соответствии с в этой ссылке а>
from pyspark import SparkContext, SQLContext, SparkConf
from operator import add
conf = SparkConf()
conf.setMaster("spark://localhost:7077")
conf.setAppName("Test")
sc = SparkContext(conf=conf)
sqlContext = SQLContext(sc)
df = sqlContext.createDataFrame([(2012, 8, "Batman", 9.8), (2012, 8, "Hero", 8.7), (2012, 7, "Robot", 5.5), (2011, 7, "Git", 2.0)],["year", "month", "title", "rating"])
df.write.mode('overwrite').format("com.databricks.spark.avro").save("file:///Users/abhattac/PycharmProjects/WordCount/users")
Для этого требуется, чтобы файл avro jar от Databrick был отправлен на рабочий узел. Я могу сделать это с помощью spark-submit из оболочки следующим образом:
/usr/local/Cellar/apache-spark/1.6.1/bin/pyspark AvroFile.py --packages com.databricks:spark-avro_2.10:2.0.1
Я не мог узнать, как предоставить параметр --packages, когда я запускаю его из PyCharm IDE. Любая помощь будет оценена.