Вопросы по теме 'airflow-scheduler'

Как Airflow подключается к Spark и можно ли установить разные права доступа для пользователей в Airflow?
Привет, я все еще новичок в Airflow. Я хотел бы знать, как Airflow подключается к Spark? У меня есть сервер с разными учетными записями (или профилями) для доступа к кластеру Spark. Интересно, есть ли у Airflow фиксированный профиль для подключения...
288 просмотров

Как включить SSL в Apache Airflow?
Я использую Airflow 1.7.0 с LocalExecutor, и документация предполагает, что для включения SSL нам нужно передать путь сертификата и ключа и изменить порт на 443, как показано ниже. [webserver] web_server_ssl_cert = <path to cert>...
4885 просмотров

Повторный запуск неудачных SubDAG
Я играл с SubDAG. Большой проблемой, с которой я столкнулся, является то, что всякий раз, когда что-то в SubDAG выходит из строя, и я повторно запускаю что-то, нажимая Clear, повторно запускается только очищенная задача; успех не распространяется на...
335 просмотров
schedule 26.11.2022

Ошибка воздушного потока - файл журнала не является локальным
Я пытаюсь выполнить сценарий Airflow и получаю сообщение об ошибке при проверке журналов Task_id в представлении графика: Hi, Я получаю, что файл журнала не является локальной ошибкой при запуске сценария Airflow. Ниже приводится сообщение об...
2044 просмотров
schedule 05.08.2022

Настройка среды Apache Airflow
Можно ли использовать одну установку Apache Airflow для работы с несколькими средами? например. Dev, QA1, QA2 и Production (если да, пожалуйста, объясните), или мне нужна отдельная установка для каждого? Какой будет лучший дизайн с учетом...
414 просмотров
schedule 23.04.2024

Как остановить выполнение задач Airflow с выключенных дагов
Я создал несколько DAG-файлов, запустил их и остановил их в середине выполнения (с помощью кнопки OFF). Однако пользовательский интерфейс по-прежнему показывает «Выполняемые задачи» для этих остановленных групп DAG. Я попытался установить...
2943 просмотров
schedule 04.11.2023

Какую start_date следует использовать для DAG, запускаемого вручную?
Многие из дагов с примерами воздушного потока , для которых schedule_interval=None задано динамическое начало дата, например airflow.utils.dates.days_ago(2) или _ 3_ . Однако docs рекомендуют против динамической даты начала: Мы не...
4596 просмотров
schedule 01.08.2023

Остановить выполнение оставшихся задач в воздушном потоке
У меня есть три задачи t1,t2,t3 . каждый вывод задачи является вводом следующей задачи, например, t1 вывод является t2 вводом. После завершения t1 я получаю пустую выходную папку (что может случиться в моем случае, и это приемлемо и помечено...
3891 просмотров
schedule 19.04.2023

Сбросить время выполнения DAG воздушного потока
В настоящее время у меня есть dag, который запланирован @daily и обычно должен срабатывать сразу после полуночи, чтобы работать с данными предыдущего дня. Каким-то образом теперь он начал работать в 11:30 из-за того, что в прошлом были проблемы,...
2014 просмотров
schedule 03.06.2024

Airflow 1.10 - большая задержка между задачами
У меня проблема с долгим ожиданием между задачами в одной DAG. У меня Airflow 1.10. Кто-нибудь может указать, какие настройки актуальны для твика? См. пример ниже. Самое долгое ожидание здесь — более полутора часов.
1120 просмотров
schedule 30.08.2022

Планировщик воздушного потока не получает задание
Я создал новый Dag со следующими аргументами: default_args = { 'owner': 'airflow', 'depends_on_past': False, 'start_date': datetime.now(), 'email': ['[email protected]'], 'email_on_failure': False, 'email_on_retry':...
2865 просмотров
schedule 02.10.2023

Группы обеспечения доступности баз данных Airflow, не запущенные в Google Cloud Composer: зависимости, блокирующие задачу от получения расписания
Я только что установил среду Cloud Composer на Python 3 и версию образа Composer composer-1.4.0-airflow-1.10.0 . Все настройки в остальном "стоковые"; т.е. без переопределения конфигурации. Я пытаюсь протестировать чрезвычайно простой DAG. Он...
1668 просмотров

Секреты в Google Cloud Bucket
Мы хотим иметь производственную среду воздушного потока, но не знаем, как правильно обращаться с секретами, в частности с файлами JSON клиента google bigquery. Мы попытались настроить секреты кубернетов в автоматически созданном кластере кубернетов...
76 просмотров
schedule 01.10.2022

python — Как настроить dag воздушного потока для запуска два раза в день
Благодаря моим недавним исследованиям я пришел к выводу, что schedule_interval для воздушного потока имеет некоторые особенности, и я сделал все возможное, чтобы попытаться интерпретировать, как это может влиять на то, что я делаю, но не совсем...
2280 просмотров
schedule 01.01.2023

Запуск хранимой процедуры в Airflow
Я пытаюсь запустить хранимую процедуру в Airflow. Просто я импортировал оператор mssql и попытался выполнить следующее: sql_command = """ EXEC [spAirflowTest] """ t3 = MsSqlOperator( task_id = 'run_test_proc', mssql_conn_id =...
2962 просмотров

Airflow 1.10.3 - Пустые недавние задачи и запуски DAG
Я установил Airflow 1.10.3 на Ubuntu 18.10 и могу добавлять свои DAG-файлы и запускать их, но «Недавние задачи» и «DAG Runs» в веб-интерфейсе пусты. Все, что я вижу, - это черный пунктирный круг, который продолжает загружаться, но ничего не...
1263 просмотров
schedule 30.09.2022

Celery Принимает больше задач, чем параллелизм рабочих
Я выполняю несколько длительных задач в выделенной очереди. Так что краткосрочных задач не бывает. В настоящее время, когда я запускаю несколько задач в одной очереди, новые задачи отправляются работнику, который уже заполнен, т.е. нет задач =...
653 просмотров

Изменение рабочей очереди в реальном времени в Apache Airflow
В Apache Airflow я могу указать рабочую очередь при запуске рабочего. У меня есть вариант использования, когда я хотел бы изменить очередь, которую рабочий использует в прямом эфире, чтобы существующий рабочий вытягивал новые задания из этой...
92 просмотров

Запуск внешнего тега с помощью другого тега в Airflow
Имея список задач, которые вызывают разные даги в главном даге. Я использую для этого TriggerDagrunoperator. Но столкнулся с несколькими проблемами. TriggerDagrunoperator не дожидается завершения внешнего dag, он запускает следующую задачу. Я...
2643 просмотров
schedule 22.03.2022

Запретить Планировщику запускать перекрывающуюся задачу
airflow.cfg : # airflow version = 1.10.1 executor = LocalExecutor parallelism = 32 dag_concurrency = 16 И dag.py: with DAG('mydag', schedule_interval="@hourly") as dag: # define tasks Но иногда моя задача выполняется дольше, чем...
370 просмотров
schedule 21.05.2022