Вопросы по теме 'impala'

Поддерживает ли Cloudera impala mongodb?
Impala поддерживает прямой запрос данных в индексах распределенной файловой системы Hadoop (HDFS) и HBase (база данных NoSQL), поддерживает ли она mongodb (база данных NoSQL)?
1397 просмотров
schedule 15.06.2022

загрузить данные в секционированную таблицу impala
У меня есть данные в HDFS в следующей структуре каталога: /exported/2014/07/01/00/SEARCHES/part-m-00000.bz2 part-m-00001.bz2 /exported/2014/07/01/02/SEARCHES/part-m-00000.bz2...
1714 просмотров

Cloudera Impala: как он считывает данные из блоков HDFS?
У меня был основной вопрос в Импале. Мы знаем, что Impala позволяет запрашивать данные, хранящиеся в HDFS. Теперь, если файл разбит на несколько блоков, и, скажем, строка текста распределена по двум блокам. В Hive/MapReduce об этом позаботится...
710 просмотров
schedule 12.03.2024

Cloudera Impala - это фреймворк, потребляющий память?
Я использую bigdata в своем проекте, чтобы сократить время работы, которое требуется моему ETL для выполнения. Я хотел бы понять, интенсивно ли используется CloudEra Impala Framework в памяти, поскольку он возвращает результаты очень быстро и...
140 просмотров
schedule 24.05.2022

Impyla UDF - где находится numba.ext.impala?
Кто-нибудь знает, где я могу найти расширение numba impala ( numba.ext.impala ), упомянутое в этом примере impyla: https://github.com/cloudera/impyla/tree/master/examples/iris_model ? Я много искал на github, а также в Google, но безуспешно....
215 просмотров
schedule 17.11.2022

Impala SQL - Как подсчитать месяцы между временными метками?
Используя Impala SQL, есть ли краткий способ подсчета количества месяцев между двумя временными метками? Функция datediff возвращает только количество дней между двумя отметками времени, но я надеюсь, что есть элегантный способ выполнить тот же...
5454 просмотров
schedule 08.05.2022

Собственная UDF Impala (Cpp) случайным образом дает результат NULL для одних и тех же входных данных в одной таблице для нескольких вызовов в одном запросе.
У меня есть Native Impala UDF (Cpp) с двумя функциями. Обе функции дополняют друг друга. String myUDF(BigInt) BigInt myUDFReverso(String) myUDF("myInput") дает некоторый вывод, который, когда myUDFReverso(myUDF("myInput")) должен вернуть...
236 просмотров

Установить размер файла быстрого вывода паркета - улей?
Я пытаюсь разделить файлы parquet / snappy, созданные hive INSERT OVERWRITE TABLE ... на границе dfs.block.size, поскольку импала выдает предупреждение, когда файл в разделе больше, чем размер блока. Impala регистрирует следующие ПРЕДУПРЕЖДЕНИЯ:...
9434 просмотров
schedule 03.03.2022

Микростратегия — подключение к HBase
Мы пытаемся подключить MS 9.4 к HBase через коннектор Impala. Сначала мы создали таблицы куста, сравнив их с таблицами HBase со следующей таблицей создания (как мы видели в документах): CREATE TABLE hiveTableName1 (key int, columnName1...
958 просмотров
schedule 19.12.2023

Группа Impala по разделенным столбцам
У меня есть внутренняя таблица impala, разделенная на несколько столбцов, и я хочу выполнить группировку по некоторым полям, включая столбцы разделения, в основном мой запрос выглядит так: select market, col1, count(1) from mytable group by...
1121 просмотров
schedule 01.06.2023

Соедините R и Impala
Я, конечно, знаю о воспроизводимом примере и фрагменте кода, но для этого вопроса я должен быть (я не могу быть иначе) неясным. Я пытаюсь соединить R и Impala . Оставим в стороне проблемы («официально» я не могу установить программное обеспечение...
7841 просмотров
schedule 21.12.2023

Таблица 9.2: Ошибка при использовании Impala для подключения к Cloudera CDH 5.5.1
Установка: - CDH 5.5.1 с Impala 2.3.0 - Tableau 9.2 с Cloudera ODBC Connector 2.5.30 Я могу добавить соединение в Tableau к моему кластеру, и я могу перечислить схемы и таблицы. Однако, как только я выбираю столбец на листе, я получаю следующую...
495 просмотров
schedule 28.12.2022

Работа с огромными наборами данных с помощью Impala
У меня есть общий вопрос об Impala и некоторых традиционных системах баз данных SQL. Я слышал, что Impala может воспринимать определенные операторы SQL буквально и выдавать таблицы с миллиардами строк (например, что может произойти с оператором...
32 просмотров
schedule 28.02.2024

Вызов JDBC для импалы/улья из искрового задания и загрузка таблицы
Я пытаюсь написать искровое задание в java, которое откроет соединение jdbc с Impala и позволит мне загрузить таблицу и выполнить другие операции. Как мне это сделать? Любой пример будет очень полезен. Благодарю вас!
416 просмотров
schedule 22.04.2024

Разбор формата даты для присоединения к улью
У меня есть поле даты типа String и в формате: 03/11/2001 И я хочу соединить его с другим столбцом, который находится в другом формате String: 1855-05-25 12:00:00.0 Как я могу эффективно объединить оба столбца в улье, игнорируя...
899 просмотров
schedule 21.04.2023

Вставить запись в таблицу impala на основе типа данных и имени столбца
У меня есть таблица impala, формат которой такой. +--------------------------+-----------+---------+ | name | type | comment | +--------------------------+-----------+---------+ | col_key | bigint |...
59 просмотров
schedule 01.08.2022

Форматы даты IMPALA - преобразование полной метки времени в почасовую метку времени
Мне нужно взять полный столбец меток времени (формат: YYYY-MM-DD HH:MM:SS.SSSS ) и преобразовать его в почасовую метку времени (формат: YYYY-MM-DD HH:00:00 ) Например: я хочу преобразовать существующую дату: 2016-02-26 04:00:07.766304000...
9227 просмотров
schedule 16.11.2023

Как проверить, работают ли сервисы cloudera, такие как hive, Impala, через код Java?
Я хочу выполнить несколько запросов куста, а затем мне нужно собрать различные метрики, такие как чтение/запись байтов hdfs. Для этого я написал java-код. Но перед запуском кода я просто хочу проверить, работают ли сервисы Cloudera, такие как hive,...
658 просмотров
schedule 28.12.2023

Impala/SQL: выберите подтаблицу и присоединитесь
Я пытаюсь использовать следующий код, чтобы найти данные за последний месяц в таблице_1, а затем соединить их с таблицей_2: import pandas as pd query = 'select * from table_1 where table_1.ts > "2016-07-12 00:00:00" as recent_table left join...
852 просмотров
schedule 28.05.2023

SQL/Impala: динамическое определение интервала последнего месяца
Я использую следующий код, чтобы найти данные за последний месяц: select * from table1 where timestamp > "2016-07-14 00:00:00" «2016-07-14 00:00:00» вручную выбирается как дата за месяц до сегодняшнего дня. Однако я не хочу менять дату...
1987 просмотров
schedule 24.10.2023