УНИКАЛЬНОЕ ОГРАНИЧЕНИЕ Postgres для массива

Как создать ограничение на уникальность всех значений в массиве типа:

CREATE TABLE mytable
(
    interface integer[2],
    CONSTRAINT link_check UNIQUE (sort(interface))
)

моя функция сортировки

create or replace function sort(anyarray)
returns anyarray as $$
select array(select $1[i] from generate_series(array_lower($1,1),
array_upper($1,1)) g(i) order by 1)
$$ language sql strict immutable;

Мне нужно что бы значения {10, 22} и {22, 10} считались одинаковыми и проверялись в рамках UNIQUE CONSTRAINT

postgresql arrays unique-constraint

uralbash 09.12.2011 источник

Ответы (3)

arrow_upward
18
arrow_downward

Я не думаю, что вы можете использовать функцию с уникальным ограничением но вы можете использовать уникальный индекс. Итак, учитывая функцию сортировки, что-то вроде этого:

create function sort_array(anyarray) returns anyarray as $$ select array_agg(distinct n order by n) from unnest($1) as t(n); $$ language sql immutable;

Тогда вы можете сделать это:

create table mytable ( interface integer[2] ); create unique index mytable_uniq on mytable (sort_array(interface));

Затем происходит следующее:

=> insert into mytable (interface) values (array[11,23]); INSERT 0 1 => insert into mytable (interface) values (array[11,23]); ERROR: duplicate key value violates unique constraint "mytable_uniq" DETAIL: Key (sort_array(interface))=({11,23}) already exists. => insert into mytable (interface) values (array[23,11]); ERROR: duplicate key value violates unique constraint "mytable_uniq" DETAIL: Key (sort_array(interface))=({11,23}) already exists. => insert into mytable (interface) values (array[42,11]); INSERT 0 1

mu is too short 09.12.2011

arrow_upward
13
arrow_downward

@mu уже продемонстрировал, как индекс выражения может решить вашу проблема.

Мое внимание привлекли используемые функции. Оба кажутся излишними для массива из двух целых чисел. Это может быть упрощением реальной ситуации. (?)

В любом случае, я был заинтригован и провел тест с парой вариантов.

Испытательная установка

-- temporary table with 10000 random pairs of integer CREATE TEMP TABLE arr (i int[]); INSERT INTO arr SELECT ARRAY[(random() * 1000)::int, (random() * 1000)::int] FROM generate_series(1,10000);

Протестируйте кандидатов с кратким комментарием для объяснения каждого из них:

-- 1) mu's query CREATE OR REPLACE FUNCTION sort_array1(integer[]) RETURNS int[] AS $$ SELECT array_agg(n) FROM (SELECT n FROM unnest($1) AS t(n) ORDER BY n) AS a; $$ LANGUAGE sql STRICT IMMUTABLE; -- 2) simplified with ORDER BY inside aggregate (pg 9.0+) CREATE OR REPLACE FUNCTION sort_array2(int[]) RETURNS int[] AS $$ SELECT array_agg(n ORDER BY n) FROM unnest($1) AS t(n); $$ LANGUAGE sql STRICT IMMUTABLE; -- 3) uralbash's query CREATE OR REPLACE FUNCTION sort_array3(anyarray) RETURNS anyarray AS $$ SELECT ARRAY( SELECT $1[i] FROM generate_series(array_lower($1,1), array_upper($1,1)) g(i) ORDER BY 1) $$ LANGUAGE sql STRICT IMMUTABLE; -- 4) change parameters to int[] CREATE OR REPLACE FUNCTION sort_array4(int[]) RETURNS int[] AS $$ SELECT ARRAY( SELECT $1[i] FROM generate_series(array_lower($1,1), array_upper($1,1)) g(i) ORDER BY 1) $$ LANGUAGE sql STRICT IMMUTABLE; -- 5) simplify array_lower() - it's always 1 CREATE OR REPLACE FUNCTION sort_array5(int[]) RETURNS int[] AS $$ SELECT ARRAY( SELECT $1[i] FROM generate_series(1, array_upper($1,1)) g(i) ORDER BY 1) $$ LANGUAGE sql STRICT IMMUTABLE; -- 6) further simplify to case with 2 elements CREATE OR REPLACE FUNCTION sort_array6(int[]) RETURNS int[] AS $$ SELECT ARRAY( SELECT i FROM (VALUES ($1[1]),($1[2])) g(i) ORDER BY 1) $$ LANGUAGE sql STRICT IMMUTABLE; -- 7) my radically simple query CREATE OR REPLACE FUNCTION sort_array7(int[]) RETURNS int[] AS $$ SELECT CASE WHEN $1[1] > $1[2] THEN ARRAY[$1[2], $1[1]] ELSE $1 END; $$ LANGUAGE sql STRICT IMMUTABLE; -- 8) without STRICT modifier CREATE OR REPLACE FUNCTION sort_array8(int[]) RETURNS int[] AS $$ SELECT CASE WHEN $1[1] > $1[2] THEN ARRAY[$1[2], $1[1]] ELSE $1 END; $$ LANGUAGE sql IMMUTABLE;

Полученные результаты

Я выполнил каждую примерно по 20 раз и взял лучший результат у EXPLAIN ANALYZE.

SELECT sort_array1(i) FROM arr -- Total runtime: 183 ms SELECT sort_array2(i) FROM arr -- Total runtime: 175 ms SELECT sort_array3(i) FROM arr -- Total runtime: 183 ms SELECT sort_array4(i) FROM arr -- Total runtime: 183 ms SELECT sort_array5(i) FROM arr -- Total runtime: 177 ms SELECT sort_array6(i) FROM arr -- Total runtime: 144 ms SELECT sort_array7(i) FROM arr -- Total runtime: 103 ms SELECT sort_array8(i) FROM arr -- Total runtime: 43 ms (!!!)

Это результаты сервера v9.0.5 на Debian Squeeze. Аналогичные результаты на v.8.4.

Я также протестировал варианты plpgsql, которые оказались немного медленнее, чем ожидалось: слишком много накладных расходов для крошечной операции, нет плана запроса для кэширования.

Простая функция (номер 7) работает значительно быстрее остальных. Этого и следовало ожидать, накладные расходы других вариантов слишком велики для крошечного массива.

Но то, что без модификатора STRICT более чем удваивает скорость, не ожидалось. По крайней мере, я этого не сделал. Я разместил здесь вопрос об этом явлении.

Erwin Brandstetter 10.12.2011

arrow_upward
9
arrow_downward

Просто создайте уникальный индекс для двух значений:

create unique index ix on mytable(least(interface[1], interface[2]), greatest(interface[1], interface[2]));

a_horse_with_no_name 10.12.2011

comment

+1 за еще одну краткую версию! Выполняется почти так же быстро, как оператор CASE. Если индекс более полезен для хранения двух целых чисел вместо массива, это путь. - Erwin Brandstetter; 10.12.2011

comment

Проблема с этой опцией заключается в том, что вы не можете использовать полученный индекс в своих запросах. - seanlinsley; 05.07.2015

УНИКАЛЬНОЕ ОГРАНИЧЕНИЕ Postgres для массива

Ответы (3)

Испытательная установка

Полученные результаты

Похожие вопросы