Я пытаюсь выполнить анализ данных в R для группы наборов данных среднего размера. Один из анализов, которые мне нужно выполнить, требует, чтобы я выполнил полное внешнее соединение примерно между 24-48 файлами, каждый из которых имеет около 60 столбцов и до 450 000 строк. Так что я часто сталкивался с проблемами памяти.
Я думал, что ffbase или sqldf помогут, но, по-видимому, полное внешнее соединение невозможно ни с одним из них.
Есть ли обходной путь? Пакет, который я еще не нашел?
data.table
. Сколько у вас оперативной памяти? - person Simon O'Hanlon   schedule 06.06.2013sqldf(..., dbname = tempfile())
. - person G. Grothendieck   schedule 06.06.2013