Я хочу иметь возможность генерировать некоторые доверительные интервалы для некоторой тестовой статистики с помощью начальной загрузки. Что я хотел бы сделать, так это нарисовать самонастраиваемый набор данных с использованием выборки с заменой из моего исходного набора данных. Я предполагаю, что это будет набор данных размера n (где n меньше, чем размер исходного набора данных), который отбирает наблюдения / строки данных из полного набора данных с заменой (так что некоторые строки могут быть нарисованы дважды).
Код, который у меня есть для одной итерации, следующий:
samp <- dat[sample(nrow(dat), 100000), ]
Этот код выбирает 100 тыс. Строк из моего набора данных (dat).
Мои вопросы следующие:
Этот код производит выборку строк с заменой? И правильно ли мое предположение: самонастраиваемый набор данных с использованием выборки с заменой эквивалентен выборке набора данных размером n (меньше исходного набора данных), который случайным образом рисует строки данных из полного набора данных с заменой (это загрузка с заменой)?