Вопросы по теме 'data-ingestion'

Как лучше всего загружать данные в Hive с помощью NiFi?
Я начал работать с NiFi. Я работаю над вариантом использования для загрузки данных в Hive. Я получаю CSV-файл, а затем использую SplitText для разделения входящего потокового файла на несколько потоковых файлов (разделение записи на запись). Затем...
5533 просмотров
schedule 17.12.2022

Druid с Kafka Ingestion: фильтрация данных
Можно ли фильтровать данные по значению измерения при передаче из Kafka в Druid? например Учитывая размер: version , который может иметь значения: v1 , v2 , v3 , я бы хотел, чтобы загружено было только v2 . Я понимаю, что это можно сделать...
689 просмотров
schedule 22.02.2023

Доступ к элементу массива после разделенного процессора в узле приема
Я пытаюсь получить доступ к элементу массива после разделения строки на массив с помощью «разделенного» процессора в конвейере узла приема? У меня длинная строка, разделенная косой чертой ('/'). Я хочу передать в индекс только одну подстроку, а...
1296 просмотров
schedule 21.06.2022

Sqoop не может импортировать из Postgres в S3
Я импортирую данные из Postgresql в hdfs и hdfs в S3 в своей повседневной работе. (sqoop import [postgres в hdfs] и distcp [из hdfs в s3]) Я хотел удалить промежуточный шаг (hdfs) и напрямую импортировать данные в корзину S3 с помощью sqoop....
94 просмотров
schedule 08.02.2024

Примеры использования Databricks Ingest
Я только что нашел новую функцию Databricks под названием Прием данных Databricks . На данный момент об этом очень мало материала. Когда мне следует использовать прием данных Databricks вместо существующих зрелых инструментов, таких как фабрика...
512 просмотров

Высокоскоростная вставка одной строки с помощью PostgreSQL и TimescaleDB
У меня есть случай с TSDB Hypertable, который выглядит примерно так: CREATE TABLE data ( pool_id INTEGER NOT NULL, ts TIMESTAMP NOT NULL, noise_err DECIMAL, noise_val DECIMAL, signal_err DECIMAL, signal_val DECIMAL, high_val DECIMAL,...
127 просмотров

Проблема с приемом данных с политикой обновления KQL; Схема запроса не соответствует схеме таблицы
Я пишу функцию, которая принимает таблицу необработанных данных (содержит данные телеметрии multijson) и переформатирует ее в несколько столбцов. Я использую .set MyTable <| myfunction|limit 0 для создания моей целевой таблицы на основе функции...
58 просмотров
schedule 18.03.2022