Скажем, у меня есть одна таблица с 50 000 элементов, и PK для каждой записи — это уникальный номер. Половина этих элементов имеет свойство «опубликовано», установленное на «1», а другое — на «0».
Большую часть времени я буду извлекать отдельные элементы с помощью хеш-ключа, но иногда я хочу иметь возможность получить ВСЕ элементы, для которых опубликовано = 1 или 0 (в идеале — пакеты с разбивкой на страницы).
У меня мог бы быть GSI с PK в атрибуте «опубликовано», но тогда у меня было бы 25 000 записей на значение, что, как я понимаю, было бы плохо, потому что PK должны быть более уникальными, чем это (пожалуйста, дайте мне знать, если я понял это неправильно).
У меня могут быть отдельные таблицы для опубликованных/неопубликованных, но в моем обычном случае использования отдельных элементов мне не нужно заранее знать, был ли элемент опубликован или нет (также Amazon говорит, что хорошо спроектированные приложения обычно имеют только одну таблицу).
Любые советы или предложения будут высоко оценены.