Семейное расположение HBase Column

есть HBase на пяти серверах с одной таблицей, содержащей один столбец Family, и я должен выполнить несколько задач map для каждого ключа и сохранить результат. главный вопрос:

чтобы сохранить локальность данных, что лучше: создать новое семейство столбцов в таблице существования или создать новую таблицу?

и Следующий вопрос:

Документация HBase предлагает использовать менее трех семейств столбцов, и, как я уже сказал, у меня есть более десяти map задач, и я хотел бы сохранить каждый результат в новом семействе столбцов. Что мне делать? потому что каждая map задача отличается от другой. важны сохранение местоположения и стоимость поиска.


person Hossein Vatani    schedule 27.08.2018    source источник
comment
Можете ли вы дать ссылку на документацию, в которой говорится о 3 семействах столбцов в таблице?   -  person AdamSkywalker    schedule 01.09.2018
comment
@AdamSkywalker, рассмотрите эту ссылку hbase.apache.org/ 1.2/book.html#number.of.cfs   -  person Hossein Vatani    schedule 09.09.2018
comment
спасибо за ссылку. Обратите внимание, что эта рекомендация в основном касается записи в разные CF. Для чтения это не очень важно.   -  person AdamSkywalker    schedule 10.09.2018


Ответы (1)


что лучше: создать новое семейство столбцов в таблице существования или создать новую таблицу

Я бы рекомендовал больше заботиться о схеме и простоте дизайна таблиц, а не пытаться взломать внутренности HBase, чтобы получить максимальную производительность. Если информация из этих двух семейств столбцов связана, и вам нужно получить доступ к обоим CF при сканировании с уменьшением карты, сохраните их в одной таблице. Если информация на 100% независима и вам никогда не нужно будет сканировать их одновременно - держите их в разных таблицах. Опять же, это вопрос дизайна схемы, не пытайтесь выполнять преждевременную оптимизацию.

Второй вопрос - я не понял о чем вы, извините.

person AdamSkywalker    schedule 09.09.2018