Как мне работать со значениями NULL в RegexSerDe? У меня есть файл с данными:
cat MOS/ex1.txt
123,dwdjwhdjwh,456
543,\N,956
У меня есть таблица:
CREATE TABLE mos.stations (usaf string, wban STRING, name string)
ROW FORMAT SERDE 'org.apache.hadoop.hive.contrib.serde2.RegexSerDe'
WITH SERDEPROPERTIES (
"input.regex" = "(.*),(.*),(.*)"
);
Я успешно загрузил данные из файла в таблицу:
LOAD DATA LOCAL INPATH '/home/hduser/MOS/ex1.txt' OVERWRITE INTO TABLE mos.stations;
Простой выбор работает нормально:
hive> select * from mos.stations;
123dwdjwhdjwh456
543\N956
И далее заканчивается ошибкой:
select * from mos.stations where wban is null;
[Hive Error]: Query returned non-zero code: 9, cause: FAILED: Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.MapRedTask
Что не так?