Вычисляемое поле Data Studio: как извлечь домен из url

У меня есть отчет Data Studio с документом Google Sheet в качестве источника данных. В источнике данных у меня есть столбец с URL-адресами - для создания красивого отчета мне нужны домены. До сих пор я извлекал домены из URL-адресов прямо в Google Sheet - я использовал следующую формулу:

=IFNA(trim(REGEXEXTRACT(REGEXREPLACE(REGEXREPLACE(BT2,"https?://",""),"^(w{3}\.)?","")&"/","([^/?]+)")),"")

и я получаю от https://www.example.com/pag.htmlexample.com, что является ожидаемым результатом.

Но как должно выглядеть регулярное выражение, которое делает то же самое, в Студии данных?

Я пробовал два варианта выражения s, но добился ожидаемого результата только по частям:

  • REGEXP_EXTRACT(URL, "//(.*?)/") - но с этим выражением субдомен, как и www, остается нефильтрованным.

  • REGEXP_EXTRACT(URL, '^[^.]+.([^.]+)') - извлекает только доменное имя - без поддомена, но и без TLD.

Как я могу улучшить последнее выражение, чтобы отфильтровать любой субдомен, а не только www?


person Evgeniy    schedule 29.04.2021    source источник


Ответы (1)


Адаптировал соответствующую формулу Google Таблиц в вопросе к Google Data Studio, используя Расчетное поле :

TRIM(REGEXP_EXTRACT(REGEXP_REPLACE(REGEXP_REPLACE(URL, "https?://", ""), R"^(w{3}\.)?", ""), "([^/?]+)"))

Редактируемый отчет Google Data Studio (встроенный Google Sheets Data Source) и GIF для уточнения:

person Nimantha    schedule 29.04.2021