Какие шаги выполняет «Повторное сканирование»?

Для автоматического хранения документов из Cloudant в dashDB существует процесс обнаружения схемы (SDP), который автоматизирует перенос данных за вас. При использовании SDP для хранения документов из Cloudant в dashDB есть опция «Повторное сканирование».

Я использовал «Повторное сканирование» несколько раз, но мне неясны шаги, которые он на самом деле выполняет. Какие шаги выполняет «Повторное сканирование»? Например.

  1. Удалить таблицы в целевой схеме dashDB? Какие столы?
  2. Сканировать исходную базу данных Cloudant?
  3. Воссоздать целевую схему?
  4. ...
  5. ...

person Chris Snow    schedule 30.09.2015    source источник


Ответы (1)


Шаги примерно такие, как вы предложили. Повторное сканирование будет

  1. Проверьте ранее обнаруженную схему JSON и удалите все таблицы из экземпляра dashDB, созданного для этой загрузки (оставив все пользовательские таблицы нетронутыми).

  2. Повторно откройте схему JSON, используя текущие настройки (включая размер выборки, тип алгоритма обнаружения и т. д.).

  3. Создайте новые таблицы в той же цели dashDB.

  4. Принимать вновь созданные таблицы с данными из Cloudant

  5. Подпишитесь на канал _changes от Cloudant, чтобы постоянно синхронизировать изменения документов с dashDB.

Все шаги (кроме первого) идентичны для начальной загрузки, а также функции повторного сканирования.

Основная мотивация для повторного сканирования — поддержка эволюции схемы. Всякий раз, когда структура документа в исходной базе данных Cloudant изменяется, пользователь может принять сознательное решение удалить и заново создать таблицы dashDB с помощью этой функции повторного сканирования. SDP не будет автоматизировать этот процесс, чтобы избежать потенциальных конфликтов с приложениями, зависящими от существующих таблиц dashDB.

person Holger Kache    schedule 30.09.2015