Мой вопрос касается того, как пропустить метаданные в начале файла при импорте данных в R. Мои данные имеют формат .txt, где первые строки представляют собой метаданные, описывающие данные, и их необходимо отфильтровать. Ниже приведен минимальный пример фрейма данных в формате с разделителями табуляции:
Type=GenePix Export
DateTime=2010/03/04 16:04:16
PixelSize=10
Wavelengths=635
ImageFiles=Not Saved
NormalizationMethod=None
NormalizationFactors=1
JpegImage=
StdDev=Type 1
FeatureType=Circular
Barcode=
BackgroundSubtraction=LocalFeature
ImageOrigin=150, 10
JpegOrigin=150, 2760
Creator=GenePix Pro 7.2.29.002
var1 var2 var3 var4 var5 var6 var7
1 1 1 molecule1 1F3 400 4020
1 2 1 molecule2 1B5 221 4020
1 3 1 molecule3 1H5 122 2110
1 4 1 molecule4 1D1 402 2110
1 5 1 molecule5 1F1 600 4020
Я мог бы использовать базовую команду, показанную ниже, если бы я знал строку, с которой начинаются фактические данные:
mydata <- read.table("mydata.txt",header=T, skip=15)
Который вернется;
mydata
var1 var2 var3 var4 var5 var6 var7
1 1 1 1 molecule1 1F3 400 4020
2 1 2 1 molecule2 1B5 221 4020
3 1 3 1 molecule3 1H5 122 2110
4 1 4 1 molecule4 1D1 402 2110
5 1 5 1 molecule5 1F1 600 4020
Проблема в том, что мне нужно написать сценарий, который может читать различные наборы данных, где номер строки, с которой начинаются фактические данные, варьируется от одного набора данных к другому. Я мог бы представить себе использование чего-то вроде пакета sqldf
, но я не совсем знаком с sql.
Будем очень благодарны любой помощи.