Я пытаюсь создать вычисляемое поле под названием «Страница», используя собственный источник данных для загрузки CSV — список URL-адресов с нескольких веб-сайтов, объединенных в один большой список из тысяч URL-адресов на десятках разных доменных имен в Datastudio.
В CSV у меня есть поле с именем URL. Он содержит полный URL-адрес каждой страницы, включая имя корневого домена.
У меня есть еще одно поле для каждой из этих записей, называемое корневым доменным именем. Он имеет имя корневого домена для каждого URL-адреса.
Я хотел бы извлечь имя корневого домена, указанное в одном поле, из URL-адреса, указанного в другом поле, оставив только путь к странице. URL-адреса различаются в зависимости от домена верхнего уровня — некоторые из них .com, некоторые — .co.uk, некоторые — .fr и т. д.
В конечном итоге вывод будет примерно таким:
- www.domain.com/test-page - › /test-page
- www.domain.co.uk/test-page - › /test-page
- www.domain.fr/test-page -› /test-page
- и т. д.
Кажется, что это должно быть что-то вроде этого, но очевидно, что оно не работает, поэтому я здесь сегодня:
REGEXP_REPLACE(URL,Root Domain Name,'')
Я думаю, что удаление значения одного поля из значения другого - это один из способов получить его, но может быть лучший способ просто манипулировать полем URL, чтобы удалить все до 3-го / тоже.
Мне нужно сохранить первое/после доменного имени (проблема форматирования данных).
Я буду усердно работать над этим и подумал, что должен быть кто-то, кто видел это раньше, поэтому приветствую любой вклад.
Всем хорошего дня!