Цикл for с ошибкой strsplit в R

Я хотел бы предварить этот пост, чтобы сказать, что я новичок в кодировании R и биоинформатики, и что я был бы очень признателен за некоторые комментарии от этого знающего сообщества. Моя цель для кода, размещенного ниже, состоит в том, чтобы создать круговые диаграммы, которые показывают содержание аминокислот в белке из результатов BLAST. Я загрузил файл csv из UniProt, преобразовал его в матрицу и выписал код ниже. Я продолжаю получать сообщение об ошибке: In AAs[i] = table(strsplit(BLAST_AA_seqs[i], "", useBytes = TRUE)) : количество заменяемых элементов не кратно длине замены. Столбец 8 — это выходной столбец, содержащий аминокислотные последовательности. Заранее спасибо!

mydata=read.table("CDPKbeta_BLAST_results.csv",header=TRUE,sep=",")
mydata=as.matrix(mydata)

AAs=c()
BLAST_AA_seqs=c()
for(i in 1:nrow(mydata)){
  print(i)
  BLAST_AA_seqs[i]=mydata[i,8]
  AAs[i]=table(strsplit(BLAST_AA_seqs[i],"", useBytes=TRUE))
  pie(AAs, col=rainbow(length(AAs)), main="Residue abundance")
  }

person Courtney Merz    schedule 02.12.2014    source источник
comment
Покажите нам пример данных. head(mydata), dput(mydata) ? И ожидаемые данные/график конечного результата?   -  person zx8754    schedule 02.12.2014


Ответы (1)


lal<-c()
lal[1]=table(strsplit("", "", useBytes = T))

пустая строка — проблема (BLAST_AA_seqs[i] — пустая строка)

person ABA    schedule 02.12.2014