Я хотел бы суммировать скользящие средние для ряда различных категорий при хранении записей журнала. Представьте себе сервис, который сохраняет журналы веб-сервера по одной записи за раз. Давайте представим, что у нас нет доступа к лог-записям. Таким образом, мы видим их один раз, но не имеем к ним доступа позже.
Для разных страниц, я хотел бы знать
- общее количество попаданий (легко)
- «недавнее» среднее значение (например, один месяц или около того)
- «долгосрочное» среднее (более года)
Существует ли какой-нибудь умный алгоритм/модель данных, который позволяет сохранять такие скользящие средние без необходимости их пересчета путем суммирования огромных объемов данных?
Мне не нужно точное среднее значение (ровно 30 дней или около того), а просто индикаторы тренда. Так что некоторая нечеткость вообще не проблема. Он должен просто убедиться, что новые записи имеют больший вес, чем старые.
Одним из решений, вероятно, было бы автоматическое создание записей статистики за каждый месяц. Однако мне даже не нужна статистика за прошлый месяц, так что это кажется излишним. И это не дало бы мне скользящее среднее, а скорее переходило бы к новым значениям из месяца в месяц.