Я пытаюсь написать немного кода на R, который берет образцы данных из Excel и определяет наиболее подходящее распределение для данных, а затем параметры для указанного распределения. После небольшого поиска в Google я решил попробовать fitdistrplus для подгонки дистрибутивов и увидел, что gofstat - это функция, которую можно использовать для проверки соответствия. Я хотел сравнить статистику GOF, чтобы найти наиболее подходящее распределение в цикле.
Начальная часть моего кода буквально просто импортирует мои образцы данных из Excel (я создал 1000 значений, обычно распределенных в Excel, и сохранил их как один столбец в формате CSV), и пытаюсь подогнать их под распределение и график. результаты, достижения.
library(fitdistrplus)
testData = read.table("C:\\Users\\Havok\\Documents\\Skripsie\\Excel\\NormalTest1.csv", header=FALSE)
(func <- apply(testData, 2, fitdist, "norm"))
gofstat(func)
for(i in 1:1000)
plot(f[[i]])
Однако всякий раз, когда я пытаюсь запустить код, я получаю сообщения об ошибках.
gofstat (func) Ошибка в gofstat (func): аргумент f должен быть объектом 'fitdist' или списком объектов 'fitdist'. for (i in 1: 1000) + plot (f [[i]]) Ошибка в f [[i]]: индекс за пределами
Графики все еще появляются, несмотря на ошибку «индекс вне границ» (я думаю, это может быть из-за случайных отрицательных значений в импортированных данных), но я действительно хочу выяснить, что не так с моим использованием gofstat. Любые идеи?
P.S. Мой опыт работы с R ограничен одним модулем, который у нас был в университете, и он был довольно простым. Так что любые продвинутые приемы будут оценены по достоинству.