Я пытаюсь написать функцию, которая ведет себя следующим образом, но это оказывается очень сложно:
DF <- data.frame(x = seq(1,10), y = rep(c('a','b','c','d','e'),2))
> DF
x y
1 1 a
2 2 b
3 3 c
4 4 d
5 5 e
6 6 a
7 7 b
8 8 c
9 9 d
10 10 e
>OverLapSplit(DF,nsplits=2,overlap=2)
[[1]]
x y
1 1 a
2 2 b
3 3 c
4 4 d
5 5 e
6 6 a
[[2]]
x y
1 5 a
2 6 b
3 7 c
4 8 d
5 9 e
6 10 a
>OverLapSplit(DF,nsplits=1)
[[1]]
x y
1 1 a
2 2 b
3 3 c
4 4 d
5 5 e
6 6 a
7 7 b
8 8 c
9 9 d
10 10 e
>OverLapSplit(DF,nsplits=2,overlap=4)
[[1]]
x y
1 1 a
2 2 b
3 3 c
4 4 d
5 5 e
6 6 a
7 7 b
[[2]]
x y
1 4 e
2 5 a
3 6 b
4 7 c
5 8 d
6 9 e
7 10 a
>OverLapSplit(DF,nsplits=5,overlap=1)
[[1]]
x y
1 1 a
2 2 b
3 3 c
[[2]]
x y
1 3 c
2 4 d
3 5 e
[[3]]
x y
1 5 e
2 6 a
3 7 b
[[4]]
x y
1 7 b
2 8 c
3 9 d
[[5]]
x y
1 8 d
2 9 e
3 10 f
Я не особо задумывался о том, что произойдет, если вы попробуете что-то вроде OverLapSplit(DF,nsplits=2,overlap=1)
Возможно следующее:
[[1]]
x y
1 1 a
2 2 b
3 3 c
4 4 d
5 5 e
[[2]]
x y
1 5 a
2 6 b
3 7 c
4 8 d
5 9 e
6 10 a
Спасибо!
rollapply
. Может быть, я должен просто задать вопрос напрямую? - person Zach   schedule 13.04.20111:31
,2:32
и т. д., и извергнуть их на свои узлы - что @Joris и я сделали, так это разделили данные на равные перекрывающиеся разделы, и это не совсем то, что я думал, что ваш кодrollapply()
делал. - person Gavin Simpson   schedule 14.04.20111:31
... на100:131
, может иметь смысл разделить их на1:81
и50:131
. - person Zach   schedule 14.04.2011lm.fit()
? Интересная проблема однако. - person Gavin Simpson   schedule 14.04.2011glm
,glmnet
или какой-то другой алгоритм, если обнаружу, что он дает лучшие прогнозирующие результаты. Поэтому я пытаюсь найти способ распараллелить анализ. - person Zach   schedule 14.04.20111:31
2:32
сплиты подходящими для фермерства, как вы описали. stackoverflow.com/questions/5543387/ - person Zach   schedule 14.04.2011