Вопросы по теме 'hive'

Разница между свиньей и ульем? Почему есть оба?
Мой опыт - 4 недели в мире Hadoop. Немного поэкспериментировал с Hive, Pig и Hadoop, используя виртуальную машину Hadoop от Cloudera. Прочитал документ Google по Map-Reduce и GFS ( ссылка в формате PDF ). Я это понимаю- Свиной язык...
207795 просмотров
schedule 03.02.2024

Объедините несколько строк в одну строку, разделенную пробелом
Итак, у меня есть 5 строк, как это userid, col -------------- 1, a 1, b 2, c 2, d 3, e Как бы я сделал запрос, чтобы он выглядел так userid, combined 1, a b 2, c d 3, e
29416 просмотров
schedule 08.07.2022

Hive: запись заголовков столбцов в локальный файл?
Снова отсутствует документация по улью: Я хочу записать результаты запроса в локальный файл, а также имена столбцов. Поддерживает ли это Hive? Insert overwrite local directory 'tmp/blah.blah' select * from table_name; Также отдельный...
71415 просмотров
schedule 12.05.2023

Запрос Hadoop Hive: множественное соединение
Как я могу сделать подвыбор в Hive? Я думаю, что могу совершить действительно очевидную ошибку, которая не так очевидна для меня... Я получаю сообщение об ошибке: FAILED: Parse Error: line 4:8 cannot recognize input 'SELECT' in expression...
20731 просмотров
schedule 12.11.2023

Команда Sqoop --hive-import не удалась
Я пытаюсь импортировать базу данных из mysql в Hive с помощью Hadoop с автоматическим созданием таблицы и загрузкой данных в куст с помощью команды «--hive-import» из Sqoop. Я использую команду ниже для выполнения импорта с помощью sqoop...
3873 просмотров
schedule 19.04.2022

как объединить данные при загрузке их в куст?
Я пытаюсь использовать hive для анализа нашего журнала, и у меня есть вопрос. Предположим, у нас есть такие данные: A 1 A 1 A 1 B 1 C 1 B 1 Как мне сделать так в Hive? таблица(порядок не важен, я просто хочу их объединить) ? A 1 B 1 C 1 без...
5026 просмотров
schedule 10.06.2024

HIVE/HDFS для хранения данных датчиков в реальном времени в больших масштабах?
Я оцениваю системы сбора данных датчиков со следующими требованиями: 1 миллион конечных точек отправляют 100 байт данных каждую минуту (в виде временных рядов). В основном миллионы мелких операций записи в хранилище. This data is...
2521 просмотров
schedule 23.06.2022

Можно ли создать кластер Hadoop, включающий Hbase, Hive и Pig, на EC2 с помощью Whirr
Можно ли создать кластер Hadoop с Hbase, Hive и Pig на Amazon EC2 с помощью Whirr??
294 просмотров
schedule 11.07.2023

Оптимизация нескольких ГБ данных в Hadoop Hive
Я довольно широко использую Hive, и мне было интересно, есть ли способ улучшить следующий рабочий процесс. Каждую ночь дамп несжатого текстового файла с разделителями табуляции из нашего кластера Oracle записывается в HDFS для обработки Hive. Я...
1823 просмотров
schedule 30.12.2023

Объединение двух таблиц в улье
У меня есть таблица, в которой я разделил дату по годам, месяцам и датам 'ABC' Раздел по (год='2011', месяц='08', день='01') Я хочу запустить запрос что-то вроде select * from ABC where dt>='2011-03-01' and dt<='2012-02-01';...
1242 просмотров
schedule 24.04.2024

Доступ к существующим строкам в таблице HBase через Hive
Есть ли способ получить доступ к существующим записям таблицы HBase через Hive?
1400 просмотров
schedule 10.04.2023

Ошибка при выполнении программы с Hive JDBC
Я написал эту небольшую программу для Hive JDBC. Первоначально он выполняется нормально, но когда я попытался запустить сейчас, я внезапно получил ошибку. Программа: import java.io.FileWriter; import java.io.InputStream; import...
8200 просмотров
schedule 12.02.2023

код возврата ошибки выполнения улья 2 из org.apache.hadoop.hive.ql.exec.mapredtask
У меня есть один запрос. Он отлично работает в Hive CLI и возвращает результат. Но когда я выполняю его с помощью Hive JDBC, я получаю следующую ошибку: java.sql.SQLException: Query returned non-zero code: 9, cause: FAILED: Execution Error,...
25503 просмотров
schedule 04.03.2023

Столбец Hive как выбор подзапроса
Я пытаюсь сделать что-то вроде ниже с Hive. Как я могу определить столбец в Hive как подзапрос? Возможно ли это в Hive? hive -e " select distinct i.SearchListingID, (select count(*) from calls c where c.ServiceID =...
23774 просмотров
schedule 24.01.2024

Интеграция Apache Mahout с Apache Hive
Я сохранил свои наборы данных в Apache Hive, но хотел бы использовать Mahout для данных в базе данных Hive. Как мне интегрировать Mahout и Hive, чтобы заставить Mahout читать из базы данных Hive?
653 просмотров
schedule 10.07.2022

Взорвать массив структур в улье
Это таблица улья ниже CREATE EXTERNAL TABLE IF NOT EXISTS SampleTable ( USER_ID BIGINT, NEW_ITEM ARRAY<STRUCT<PRODUCT_ID: BIGINT,TIMESTAMPS:STRING>> ) И это данные в приведенной выше таблице - 1015826235...
100055 просмотров
schedule 24.02.2023

SQL-запрос JOIN с таблицей
select user_id, prod_and_ts.product_id as product_id, prod_and_ts.timestamps as timestamps from testingtable2 LATERAL VIEW explode(purchased_item) exploded_table as prod_and_ts; Используя приведенный выше запрос, я получаю следующий результат....
6343 просмотров
schedule 04.02.2023

EMR — Hive и Java вместе
Я использую Amazon Elastic-Map-Reduce. Можно ли запустить запрос HIVE, который использует код Java (с использованием функции преобразования)? Когда я создаю новый поток заданий, мне нужно выбирать между пользовательской банкой и программой куста,...
1188 просмотров
schedule 09.12.2023

куст RegexSerDe null
Как мне работать со значениями NULL в RegexSerDe? У меня есть файл с данными: cat MOS/ex1.txt 123,dwdjwhdjwh,456 543,\N,956 У меня есть таблица: CREATE TABLE mos.stations (usaf string, wban STRING, name string) ROW FORMAT SERDE...
1434 просмотров
schedule 02.11.2022

Могу ли я изменить таблицу с внутренней на внешнюю в улье?
Я создал таблицу в улье как управляемую, но она должна была быть внешней, можно ли изменить тип таблицы без потери данных?
34313 просмотров
schedule 15.12.2022