У меня есть отчет Data Studio с документом Google Sheet в качестве источника данных. В источнике данных у меня есть столбец с URL-адресами - для создания красивого отчета мне нужны домены. До сих пор я извлекал домены из URL-адресов прямо в Google Sheet - я использовал следующую формулу:
=IFNA(trim(REGEXEXTRACT(REGEXREPLACE(REGEXREPLACE(BT2,"https?://",""),"^(w{3}\.)?","")&"/","([^/?]+)")),"")
и я получаю от https://www.example.com/pag.html
→ example.com
, что является ожидаемым результатом.
Но как должно выглядеть регулярное выражение, которое делает то же самое, в Студии данных?
Я пробовал два варианта выражения s, но добился ожидаемого результата только по частям:
REGEXP_EXTRACT(URL, "//(.*?)/")
- но с этим выражением субдомен, как и www, остается нефильтрованным.REGEXP_EXTRACT(URL, '^[^.]+.([^.]+)')
- извлекает только доменное имя - без поддомена, но и без TLD.
Как я могу улучшить последнее выражение, чтобы отфильтровать любой субдомен, а не только www?