У нас есть несколько исходных систем, отправляющих данные. В идеале мы должны собирать необработанные данные, поступающие из источников, и хранить их в озере данных. Затем мы должны обработать необработанные данные в структурированном формате. Теперь пользователи могут обновлять эти данные через внешнее приложение.
Я думаю о том, чтобы поместить rdbms поверх обработанных данных, а затем вывести журналы аудита из rdbms в озеро данных и объединить обработанные данные и журналы аудита, чтобы создать окончательное представление для отчетности. Или rdbms также можно использовать для аналитики.
Или мы можем перенести все данные, изначально хранившиеся в rdbms, запустить изменения в rdbms и извлечь данные из rdbms в озеро данных. Но нет особого смысла вводить озеро данных.
Пожалуйста, предложите.
Спасибо,