Вопросы по теме 'spark-submit'

Как отключить отображение информационных сообщений на консоли Spark?
Я хотел бы остановить различные сообщения, которые приходят на Spark Shell. Я попытался отредактировать log4j.properties файл, чтобы остановить это сообщение. Вот содержимое log4j.properties # Define the root logger with appender file...
208148 просмотров
schedule 16.01.2022

Параметры памяти для команды Spark-submit
Как рассчитать оптимальную настройку памяти для команды spark-submit? Я привожу 4,5 ГБ данных в Spark из Oracle и выполняю некоторые преобразования, такие как соединение с таблицей Hive и запись их обратно в Oracle. У меня вопрос, как создать...
2258 просмотров

Не удалось отправить локальный jar в искровой кластер: java.nio.file.NoSuchFileException
~/spark/spark-2.1.1-bin-hadoop2.7/bin$ ./spark-submit --master spark://192.168.42.80:32141 --deploy-mode cluster file:///home/me/workspace/myproj/target/scala-2.11/myproj-assembly-0.1.0.jar Running Spark using the REST application submission...
4323 просмотров

Spark Standalone --total-executor-cores
Я использую автономный кластер Spark 2.1.1, Хотя у меня есть 29 свободных ядер в моем кластере ( Cores in use: 80 Total, 51 Used ), при отправке нового задания spark с --total-executor-cores 16 эта конфигурация не вступает в силу, и задание...
785 просмотров

spark-submit с определенными библиотеками Python
У меня есть код pyspark, зависящий от сторонних библиотек. Я хочу выполнить этот код в своем кластере, работающем под управлением mesos. У меня есть заархивированная версия моей среды Python, которая находится на http-сервере, доступном для моего...
1788 просмотров
schedule 18.10.2022

Задание отправки Spark не выполняется для режима кластера, но работает локально для copyToLocal из HDFS в java
Я запускаю код Java для копирования файлов из HDFS на локальный, используя режим кластера Spark в искровой отправке. Задание работает нормально с локальной искрой, но не работает в кластерном режиме. Он вызывает java.io.exeception: Target / mypath /...
697 просмотров

Добавьте банку в spark-submit для использования в Hive.
Я пытаюсь выполнить запрос Hive в своем коде Spark, но мне нужно использовать библиотеку jar для выполнения этого запроса с Hive, потому что я создал таблицу с этим jar, поэтому для запроса таблицы я должен ее импортировать. Мой код искры: val...
963 просмотров
schedule 17.05.2023

Разница в запуске приложения spark с помощью sbt run или скрипта spark-submit
Я новичок в Spark, и, изучая эту структуру, я понял, что, насколько мне известно, существует два способа запуска приложения spark, написанного на Scala: Упакуйте проект в файл JAR, а затем запустите его с помощью сценария spark-submit. Запуск...
1005 просмотров
schedule 11.07.2023

Должен ли я использовать spark-submit при использовании весенней загрузки
Какова цель отправки искры? Из того, что я вижу, это просто добавление свойств и банок в путь к классам. Если я использую весеннюю загрузку, могу ли я избежать использования spark-submit и просто упаковать толстую банку со всеми свойствами, которые...
114 просмотров
schedule 20.05.2022

Я хочу разбить один файл на несколько в HDFS
Я пытаюсь записать файл в hdfs, используя spark-submit. При записи файла я хочу разбить один файл на несколько, как результат mapreduce, а не один (например, часть-0000, парк-0001). вот пример кода Какие параметры я должен установить val conf...
37 просмотров
schedule 29.05.2022

Как запустить spark-submit в virtualenv для pyspark?
Есть ли способ запустить spark-submit (spark v2.3.2 из HDP 3.1.0) в виртуальном окружении? Есть ситуация, когда есть файл python, который использует python3 (и некоторые конкретные библиотеки) в virtualenv (чтобы изолировать версии lib от остальной...
3422 просмотров
schedule 27.08.2022

Spark в Google Cloud Kubernetes Cluster - сохраняет исключение исполнителей: рабочие зарегистрированы и имеют достаточно ресурсов
Я выполнил следующие инструкции, кроме minicube, я использовал кластер Google Cloud Platform Kubernetes: (Spark 2.3.2) https://testdriven.io/blog/deploying-spark-on-kubernetes/ Когда я отправляю искровые задания с:...
135 просмотров

Как отправить jar-файлы, хранящиеся в AWS S3, в Local Spark?
Вопрос : как отправить файлы jar, хранящиеся в AWS S3, в Local Spark? Я ищу способ отправить банки, хранящиеся в S3, в Local Spark (не EMR). Однако, когда я исследовал это, я увидел только то, как отправить его в кластер EMR Spark. Ближайший...
132 просмотров
schedule 19.01.2023

Не удалось отправить RPC XXXX в Hadoop 3.2.1 и spark 3.0.0 с искровой оболочкой.
Я пытаюсь запустить искровую оболочку в режиме псевдораспределения на моем компьютере с Windows 10, имеющем 8 гигабайт оперативной памяти. Я могу отправить и запустить количество слов mapreduce на пряже, но когда я пытаюсь инициализировать искровую...
288 просмотров