Вопросы по теме 'hive'
Разница между свиньей и ульем? Почему есть оба?
Мой опыт - 4 недели в мире Hadoop. Немного поэкспериментировал с Hive, Pig и Hadoop, используя виртуальную машину Hadoop от Cloudera. Прочитал документ Google по Map-Reduce и GFS ( ссылка в формате PDF ).
Я это понимаю-
Свиной язык...
207795 просмотров
schedule
03.02.2024
Объедините несколько строк в одну строку, разделенную пробелом
Итак, у меня есть 5 строк, как это
userid, col
--------------
1, a
1, b
2, c
2, d
3, e
Как бы я сделал запрос, чтобы он выглядел так
userid, combined
1, a b
2, c d
3, e
29416 просмотров
schedule
08.07.2022
Hive: запись заголовков столбцов в локальный файл?
Снова отсутствует документация по улью:
Я хочу записать результаты запроса в локальный файл, а также имена столбцов.
Поддерживает ли это Hive?
Insert overwrite local directory 'tmp/blah.blah' select * from table_name;
Также отдельный...
71415 просмотров
schedule
12.05.2023
Запрос Hadoop Hive: множественное соединение
Как я могу сделать подвыбор в Hive? Я думаю, что могу совершить действительно очевидную ошибку, которая не так очевидна для меня...
Я получаю сообщение об ошибке: FAILED: Parse Error: line 4:8 cannot recognize input 'SELECT' in expression...
20731 просмотров
schedule
12.11.2023
Команда Sqoop --hive-import не удалась
Я пытаюсь импортировать базу данных из mysql в Hive с помощью Hadoop с автоматическим созданием таблицы и загрузкой данных в куст с помощью команды «--hive-import» из Sqoop.
Я использую команду ниже для выполнения импорта с помощью sqoop...
3873 просмотров
schedule
19.04.2022
как объединить данные при загрузке их в куст?
Я пытаюсь использовать hive для анализа нашего журнала, и у меня есть вопрос.
Предположим, у нас есть такие данные: A 1 A 1 A 1 B 1 C 1 B 1 Как мне сделать так в Hive? таблица(порядок не важен, я просто хочу их объединить) ? A 1 B 1 C 1
без...
5026 просмотров
schedule
10.06.2024
HIVE/HDFS для хранения данных датчиков в реальном времени в больших масштабах?
Я оцениваю системы сбора данных датчиков со следующими требованиями:
1 миллион конечных точек отправляют 100 байт данных каждую минуту (в виде временных рядов).
В основном миллионы мелких операций записи в хранилище.
This data is...
2521 просмотров
schedule
23.06.2022
Можно ли создать кластер Hadoop, включающий Hbase, Hive и Pig, на EC2 с помощью Whirr
Можно ли создать кластер Hadoop с Hbase, Hive и Pig на Amazon EC2 с помощью Whirr??
294 просмотров
schedule
11.07.2023
Оптимизация нескольких ГБ данных в Hadoop Hive
Я довольно широко использую Hive, и мне было интересно, есть ли способ улучшить следующий рабочий процесс.
Каждую ночь дамп несжатого текстового файла с разделителями табуляции из нашего кластера Oracle записывается в HDFS для обработки Hive.
Я...
1823 просмотров
schedule
30.12.2023
Объединение двух таблиц в улье
У меня есть таблица, в которой я разделил дату по годам, месяцам и датам
'ABC' Раздел по
(год='2011', месяц='08', день='01')
Я хочу запустить запрос что-то вроде
select * from ABC where dt>='2011-03-01' and dt<='2012-02-01';...
1242 просмотров
schedule
24.04.2024
Доступ к существующим строкам в таблице HBase через Hive
Есть ли способ получить доступ к существующим записям таблицы HBase через Hive?
1400 просмотров
schedule
10.04.2023
Ошибка при выполнении программы с Hive JDBC
Я написал эту небольшую программу для Hive JDBC. Первоначально он выполняется нормально, но когда я попытался запустить сейчас, я внезапно получил ошибку.
Программа:
import java.io.FileWriter;
import java.io.InputStream;
import...
8200 просмотров
schedule
12.02.2023
код возврата ошибки выполнения улья 2 из org.apache.hadoop.hive.ql.exec.mapredtask
У меня есть один запрос. Он отлично работает в Hive CLI и возвращает результат. Но когда я выполняю его с помощью Hive JDBC, я получаю следующую ошибку:
java.sql.SQLException: Query returned non-zero code: 9, cause: FAILED: Execution Error,...
25503 просмотров
schedule
04.03.2023
Столбец Hive как выбор подзапроса
Я пытаюсь сделать что-то вроде ниже с Hive. Как я могу определить столбец в Hive как подзапрос? Возможно ли это в Hive?
hive -e "
select
distinct i.SearchListingID,
(select count(*)
from calls c
where c.ServiceID =...
23774 просмотров
schedule
24.01.2024
Интеграция Apache Mahout с Apache Hive
Я сохранил свои наборы данных в Apache Hive, но хотел бы использовать Mahout для данных в базе данных Hive.
Как мне интегрировать Mahout и Hive, чтобы заставить Mahout читать из базы данных Hive?
653 просмотров
schedule
10.07.2022
Взорвать массив структур в улье
Это таблица улья ниже
CREATE EXTERNAL TABLE IF NOT EXISTS SampleTable
(
USER_ID BIGINT,
NEW_ITEM ARRAY<STRUCT<PRODUCT_ID: BIGINT,TIMESTAMPS:STRING>>
)
И это данные в приведенной выше таблице -
1015826235...
100055 просмотров
schedule
24.02.2023
SQL-запрос JOIN с таблицей
select user_id, prod_and_ts.product_id as product_id, prod_and_ts.timestamps as
timestamps from testingtable2 LATERAL VIEW explode(purchased_item) exploded_table
as prod_and_ts;
Используя приведенный выше запрос, я получаю следующий результат....
6343 просмотров
schedule
04.02.2023
EMR — Hive и Java вместе
Я использую Amazon Elastic-Map-Reduce. Можно ли запустить запрос HIVE, который использует код Java (с использованием функции преобразования)?
Когда я создаю новый поток заданий, мне нужно выбирать между пользовательской банкой и программой куста,...
1188 просмотров
schedule
09.12.2023
куст RegexSerDe null
Как мне работать со значениями NULL в RegexSerDe? У меня есть файл с данными:
cat MOS/ex1.txt
123,dwdjwhdjwh,456
543,\N,956
У меня есть таблица:
CREATE TABLE mos.stations (usaf string, wban STRING, name string)
ROW FORMAT SERDE...
1434 просмотров
schedule
02.11.2022
Могу ли я изменить таблицу с внутренней на внешнюю в улье?
Я создал таблицу в улье как управляемую, но она должна была быть внешней, можно ли изменить тип таблицы без потери данных?
34313 просмотров
schedule
15.12.2022