Google Data Studio неверно рассчитывает метрики

Я создаю рассчитанные метрики в Студии данных, и у меня проблемы с результатами.

Метрика 1 использует эту формулу:

COUNT_DISTINCT(CASE WHEN (  Event Category = "ABC" AND Event Action = "XXX" AND Event Label = "123" ) THEN ga clientId (user) ELSE " " END )

[[Для подсчета событий с разными clientIds]]

Метрика 2 использует эту формулу:

COUNT_DISTINCT(CASE WHEN (  Event Category = "ABC" AND Event Action = "YYY" AND Event Label = "456" ) THEN ga clientId (user) ELSE " " END )

[[Для подсчета событий с разными clientIds]]

Метрика 3 использует эту формулу:

COUNT_DISTINCT(CASE WHEN (  Event Category = "ABC" AND Event Action = "ZZZ" AND Event Label = "789" ) THEN userId(user) ELSE " " END )

[[Для подсчета событий с разными идентификаторами пользователей]]

Формулы работают нормально, и когда я использую метрику 2 / метрику 1, число верное для одного дня. Когда я использую метрику 3 / метрику 2, число неверное. Почему это? Для меня это не имеет смысла, поскольку они оба являются числовыми значениями.

Кроме того, когда я увеличиваю диапазон дат, Метрика 2 / Метрика 1 тоже неверна! Есть идеи, почему они не работают?


person Tamara Caligari    schedule 10.10.2017    source источник


Ответы (2)


Если вы агрегируете определенный объем данных, эти расчеты не будут точными; они будут приблизительными.

person Lindsay Reynolds    schedule 13.10.2017

Я заметил, что Google Data Studio более точен при правильной загрузке данных в BigQuery, чем данных, загружаемых через что-то еще, например, коннектор PostgreSQL. В противном случае можно использовать APPROX_COUNT_DISTINCT.

person Flair    schedule 27.12.2018