На странице загрузок Spark, если я загружаю tar-файл для версии 2.0.1, я вижу, что он содержит некоторые файлы jar, которые я считаю полезным включить в моем приложении.
Если я загружу tar-файл для версии 1.6.2 вместо этого я не нахожу там папку jars. Есть ли альтернативный тип пакета, который я должен использовать с этого сайта? В настоящее время я выбираю значение по умолчанию (предварительно созданное для Hadoop 2.6). В качестве альтернативы, где я могу найти эти банки Spark - должен ли я получать каждую из них по отдельности с http://spark-packages.org< /а>?
Вот примерный набор баночек, которые я хочу использовать:
- Hadoop-общий
- искровой сердечник
- искра-csv
- искра-sql
- однозначность-парсеры
- искровой катализатор
- json4s-ядро
spark-assembly*.jar
под$SPARK_HOME/lib
, содержащий все зависимости. Если вам нужны отдельные JAR-файлы, вы должны перекомпилировать Spark. Веселиться! - person Samson Scharfrichter   schedule 07.03.2017spark-csv
загружается отдельно (не был встроен в кодовую базу Spark до V2) и требует Apachecommons-csv
. - person Samson Scharfrichter   schedule 07.03.2017