Я выполняю некоторую работу, обрабатывая статистику разрешений домов за определенный месяц. Я хотел бы иметь возможность показать тенденции, то есть, в каких областях наблюдалось значительное относительное увеличение или уменьшение по сравнению с последним месяцем (месяцами).
Мой первый наивный подход заключался в том, чтобы просто рассчитать процентное изменение за два месяца, но это имеет проблемы, когда данных очень мало — любое изменение вообще увеличивается:
// diff = (new - old) / old
Area | June | July | Diff |
--------------|--------|--------|--------|
South Sydney | 427 | 530 | +24% |
North Sydney | 167 | 143 | -14% |
Dubbo | 1 | 3 | +200% |
Я не хочу просто игнорировать какую-либо область или значение как выброс, но я не хочу, чтобы увеличение Dubbo на 2 в месяц затмило увеличение на 103 в Южном Сиднее. Есть ли лучшее уравнение, которое я мог бы использовать для отображения более полезной информации о тенденциях?
Эти данные в конечном итоге наносятся на Google Maps. В этой первой попытке я просто конвертирую разницу в «цвет тепловой карты» (синий — уменьшение, зеленый — без изменений, красный — увеличение). Возможно, решением может быть использование какой-либо другой метрики для изменения представления каждой области, например, изменение альфа-канала на основе общего количества одобрений или что-то подобное, в этом случае Dubbo будет ярко-красным, но довольно прозрачным, тогда как Южный Сидней был бы ближе к желтому, но довольно непрозрачным.
Любые идеи о том, как лучше всего показать эти данные?