Я хочу прочитать parquetFile в оболочке sparkR из системы hdfs. Итак, я делаю это:
./sparkR --master yarn-client
sqlContext <- sparkRSQL.init(sc)
path<-"hdfs://year=2015/month=1/day=9"
AppDF <- parquetFile(sqlContext, path)
Ошибка: No such file or directory
Но этот файл действительно существует в системе hdfs. И когда я оборачиваю этот код в файл R, например dataframe.R, и запускаю ./spark-submit --master yarn ~/dataframe.R 1000
. Это работает хорошо. Поэтому я думаю, что проблема работает на клиенте пряжи через оболочку sparkR. Может ли кто-нибудь помочь решить эту проблему?
Я использую spark-1.4.0-bin-hadoop2.6.