Создайте переменную индикатора в скрипте загрузки

Я загружаю следующую таблицу ввода

входная таблица

через этот скрипт:

source_table:
Load company,
     product,
     sales
FROM source_file1.xlsx

Теперь я хотел бы создать таблицу в сценарии, которая выглядит следующим образом: outputtable

Столбец «highest_selling» — это показатель компании, которая продает больше всего этого конкретного продукта. Как это может быть сделано? Любая помощь будет оценена по достоинству.

С уважением Даниэль


person Daniel    schedule 30.07.2015    source источник


Ответы (1)


После загрузки исходника.

source_table:
Load company,
     product,
     sales
FROM source_file1.xlsx

Затем найдите самого высокого продавца.

Highest:
Load product,
     max(sales) as Highest
resident source_table group by product;

Затем присоедините самый высокий показатель обратно к исходной таблице.

left join (source_table)
load product,
     Highest as sales,
     1 as highest_seller
resident Highest; drop table Highest;
person The Budac    schedule 31.07.2015