У меня есть данные в csv, которые содержат следующий столбец
ARTICLE_URL
http://twitter.com/aviryadsh/statuses/528219883872337920
http://www.ibtimes.co.in/2014
Я хочу создать другие столбцы рядом с этим столбцом, где у меня может быть только веб-адрес, например twitter.com, team-bhp.com, ibtimes.co.in,broadbandforum.co
.
я пытался
text$ne=str_extract(Brand$ARTICLE_URL, '\\w+(.com)')
но это дает только URL-адреса, которые заканчиваются на .com, как также получить все остальные.
tmp <- str_replace(Brand$ARTICLE_URL, "http://(www.)?", ""); text$ne <- str_replace(tmp, "/.*", "")
- person tblznbits   schedule 11.12.2015str_replace
иstr_replace_all
могут принимать регулярные выражения для поиска шаблона. Так что мы можем просто немного изменить первую часть кода:str_replace_all(Brand$ARTICLE_URL, "https://|http://|www.", "")
. Это должно удалить все с начала ваших URL-адресов. - person tblznbits   schedule 14.12.2015