Вопросы по теме 'data-ingestion'
Как лучше всего загружать данные в Hive с помощью NiFi?
Я начал работать с NiFi. Я работаю над вариантом использования для загрузки данных в Hive. Я получаю CSV-файл, а затем использую SplitText для разделения входящего потокового файла на несколько потоковых файлов (разделение записи на запись). Затем...
5533 просмотров
schedule
17.12.2022
Druid с Kafka Ingestion: фильтрация данных
Можно ли фильтровать данные по значению измерения при передаче из Kafka в Druid?
например Учитывая размер: version , который может иметь значения: v1 , v2 , v3 , я бы хотел, чтобы загружено было только v2 .
Я понимаю, что это можно сделать...
689 просмотров
schedule
22.02.2023
Доступ к элементу массива после разделенного процессора в узле приема
Я пытаюсь получить доступ к элементу массива после разделения строки на массив с помощью «разделенного» процессора в конвейере узла приема?
У меня длинная строка, разделенная косой чертой ('/'). Я хочу передать в индекс только одну подстроку, а...
1296 просмотров
schedule
21.06.2022
Sqoop не может импортировать из Postgres в S3
Я импортирую данные из Postgresql в hdfs и hdfs в S3 в своей повседневной работе. (sqoop import [postgres в hdfs] и distcp [из hdfs в s3])
Я хотел удалить промежуточный шаг (hdfs) и напрямую импортировать данные в корзину S3 с помощью sqoop....
94 просмотров
schedule
08.02.2024
Примеры использования Databricks Ingest
Я только что нашел новую функцию Databricks под названием Прием данных Databricks . На данный момент об этом очень мало материала.
Когда мне следует использовать прием данных Databricks вместо существующих зрелых инструментов, таких как фабрика...
512 просмотров
schedule
16.05.2024
Высокоскоростная вставка одной строки с помощью PostgreSQL и TimescaleDB
У меня есть случай с TSDB Hypertable, который выглядит примерно так:
CREATE TABLE data (
pool_id INTEGER NOT NULL,
ts TIMESTAMP NOT NULL,
noise_err DECIMAL,
noise_val DECIMAL,
signal_err DECIMAL,
signal_val DECIMAL,
high_val DECIMAL,...
127 просмотров
schedule
20.06.2022
Проблема с приемом данных с политикой обновления KQL; Схема запроса не соответствует схеме таблицы
Я пишу функцию, которая принимает таблицу необработанных данных (содержит данные телеметрии multijson) и переформатирует ее в несколько столбцов. Я использую .set MyTable <| myfunction|limit 0 для создания моей целевой таблицы на основе функции...
58 просмотров
schedule
18.03.2022