Я пишу программу-свинью, которая загружает файл, который разделяет его целиком с помощью вкладок.
пример: имя TAB год TAB количество TAB...
file = LOAD 'file.csv' USING PigStorage('\t') as (type: chararray, year: chararray,
match_count: float, volume_count: float);
-- Group by type
grouped = GROUP file BY type;
-- Flatten
by_type = FOREACH grouped GENERATE FLATTEN(group) AS (type, year, match_count, volume_count);
group_operat = FOREACH by_type GENERATE
SUM(match_count) AS sum_m,
SUM(volume_count) AS sum_v,
(float)sum_m/sm_v;
DUMP group_operat;
Проблема заключается в объекте групповых операций, который я пытаюсь создать. Я хочу просуммировать все счетчики совпадений, суммировать все счетчики объемов и разделить счетчики совпадений на объемы.
Что я делаю неправильно в своих арифметических операциях/создании объекта? Я получаю сообщение об ошибке: строка 7, столбец 11> скрипту свиньи не удалось проверить: org.apache.pig.impl.logicalLayer.FrontendException: ОШИБКА 1031: несовместимая схема: слева "тип: NULL, год: NULL, match_count :NULL,volume_count:NULL", справа "group:chararray"
Спасибо.