R: нужны конечные значения «ylim» в функции

Я хотел бы отображать данные в data.frame xy для каждой группы (определяемой ID). Когда год до 1946 находится в группе, следует выполнить plot 2. Когда годы находятся между 1946 и 2014, следует выполнить plot1.

Моя проблема: это прекрасно работает без значений NA, но поскольку у меня есть пробелы в данных, я полагаюсь на NA для определения этих пробелов в данных. Вот почему я получаю сообщение об ошибке: error in plot.window(need finite 'ylim' values). Я пытался поместить finite=T в plot1 по оси Y, но это дает ошибку subscript out of bounds. Есть ли способ, которым я мог бы решить эту проблему, и чтобы графика была правильно построена?

Ниже приведен мой код: он длинный, но большая часть кода состоит из plot() опций, на которые я полагаюсь.

# read in sample data and split it up by group (defined by ID)
xy <- data.frame(NAME=c("NAME2","NAME2","NAME2","NAME2","NAME2","NAME3","NAME3","NAME3","NAME3","NAME5","NAME5","NAME5","NAME5"), ID=c(48,48,48,48,48,32,32,32,32,67,67,67,67),YEAR=c(1981,1983,1984,1988,1989,1984,1984,1988,1988,1899,1933,1948,1958),VALUE=c(0,205,-570,0,-310,-3680,-3680,NA,-3680,0,NA,13,-98))
ind <- split(x = xy,f = xy[,'ID'])

# Plot Scenario 1: if only years between 1946 and 2014 are present for each group do this:
  plot1 <- function(x) {
  fname <- paste0(x[1, 'ID'], '.png')
  png(fname, width=1679, height=1165, res=150)
  par(mar=c(6,8,6,5))
  plot(x = c(1946, 2014),
       y = range(x$VALUE),
       type='n',
       main=x[1, 'NAME'],
       xlab="Time [Years]",
       ylab="Value")
  axis(2, at = seq(-100000, 100000, 500), cex.axis=1, labels=FALSE, tcl=-0.3)
  points(ind[[i]][,c('YEAR','VALUE')], type="l", lwd=2)
  points(ind[[i]][,c('YEAR','VALUE')], type="p", lwd=1, cex=1,   pch=21, bg='white')
  abline(h=0)
  dev.off()
}

# Plot Scenario 2 if years under 1946 are present do this:
plot2 <- function(x) {
  fname <- paste0(x[1, 'ID'], '.png')
  png(fname, width=1679, height=1165, res=150)    
  par(mar=c(6,8,6,5))
  plot(x[,c('YEAR','VALUE')],
       type='n',
       main=x[1, 'NAME'],
  xlab="Time [Years]",
  ylab="Value [mm]")
axis(2, at = seq(-100000, 100000, 500), cex.axis=1, labels=FALSE, tcl=-0.3)
points(ind[[i]][,c('YEAR','VALUE')], type="l", lwd=2)
points(ind[[i]][,c('YEAR','VALUE')], type="p", lwd=1, cex=1,   pch=21, bg='white')
abline(h=0)
dev.off() 
}

# Execute functions
    lapply(ind, function(x) ifelse(any(x$YEAR < 1946 & x$YEAR < 2014), plot2(x), plot1(x)))

person kurdtc    schedule 16.09.2014    source источник


Ответы (1)


В plot1 измените y = range(x$VALUE) на y = range(x$VALUE, na.rm=TRUE), чтобы удалить NA отсутствующих значений.

У вас есть еще одна проблема, а именно то, что в обеих функциях вы ссылаетесь на ind[[i]], что, я полагаю, означает, что в какой-то момент этот код был частью цикла. Я предполагаю, что все ссылки на ind[[i]] должны быть x.

person Thomas    schedule 16.09.2014
comment
это было именно так! Спасибо!! - person kurdtc; 16.09.2014
comment
в частности, я считаю, что range возвращает NA (и ничего больше). что-то вроде plot(1:5,c(2,3,NA,5,NA)) будет успешно выполнено. - person Carl Witthoft; 16.09.2014
comment
@CarlWitthoft Да, это когда оба значения из диапазона равны NA. - person Thomas; 16.09.2014