Я написал задание Flink, которое считывает данные из Kafka и записывает в файл hdfs в формате ORC для HIVE (использует 20 исполнителей). Мне нужно выполнить простое задание, которое каждый час вставляет раздел в таблицу HIVE. Можно ли запустить это простое задание по добавлению разделов в диспетчере заданий?
Можно ли запустить простое задание в диспетчере заданий во Flink?
Ответы (1)
Менеджер по работе играет только координирующую / контролирующую роль. У вас должен быть хотя бы один диспетчер задач.
Однако для выполнения простого задания вы можете использовать мини-кластер, который полностью работает в той же JVM, что и клиент / приложение. Вам нужна LocalStreamEnvironment., созданный
final StreamExecutionEnvironment env = StreamExecutionEnvironment.createLocalEnvironment();
или LocalEnvironment, если вы используете API DataSet (пакетный):
ExecutionEnvironment env = ExecutionEnvironment.createLocalEnvironment();
person
David Anderson
schedule
16.07.2020
Можно ли запускать какие-то события каждый час во время трансляции, например, использовать водяной знак или что-то еще?
- person patel akash; 17.07.2020
Я хочу сказать да, но я не совсем понимаю, что вы пытаетесь сделать. Кажется, это не связано с этим вопросом, поэтому задайте новый вопрос, и мы можем продолжить с него.
- person David Anderson; 17.07.2020