Я обрабатываю много текста/данных, которыми обмениваюсь между Python, R и иногда Matlab.
Я предпочитаю плоский текстовый файл, но также иногда использую SQLite для хранения данных и доступа из каждой программы (хотя еще не Matlab). Я не использую GROUPBY, AVG и т. д. в SQL так часто, как я делаю эти операции в R, поэтому мне не обязательно требуются операции с базой данных.
Для таких приложений, которые требуют обмена данными между программами для использования доступных библиотек на каждом языке, существует ли хорошее эмпирическое правило в отношении того, какой формат/метод обмена данными следует использовать (даже XML, NetCDF или HDF5)?
Я знаю, что между Python -> R есть rpy или rpy2, но меня интересовал этот вопрос в более общем смысле — я использую много компьютеров, на которых нет rpy2, а также использую несколько других программ для научного анализа, которым требуется доступ к данным в разное время (этапы обработки и анализа также разделены).