У меня есть набор данных, содержащий вектор имен и фамилий. Я хочу удалить имена и оставить только фамилии. Хотя и фамилии, и имена различаются по количеству слов, фамилия (имена) всегда пишутся прописными буквами и ставятся перед именами, в то время как только первая буква имени (имен) пишется с заглавной буквы.
Другими словами, у меня получается примерно следующее:
x <- c("AA AA Aa Aa", "BB BB Bb", "CC Cc Cc", "DD Dd")
И хотел бы иметь:
x
[1] "AA AA" "BB BB" "CC" "DD"
Я пытался сделать это с помощью пакета stringr, но он возвращается только к первой заглавной букве первого слова:
library(stringr)
str_extract(x, "[A-Z]")
[1] "A" "B" "C" "D"
str_extract_all(x, "([A-Z]+(?=[^a-z]))")
может быть? - person David Arenburg   schedule 11.04.2016