Для своего исследования я пытаюсь подсчитать из корпуса, сколько раз (совпадение) ряд составных терминов (например, «Опасность безопасности»), хранящихся в файле, по 1 строке на фразу, появляется в окне из 16 слов целевое ключевое слово (например, Facility). Я не программист, я пытался разбить его на 2 элемента: сначала извлеките файл из корпуса, где у меня есть совпадение по моему целевому ключевому слову, с 8 словами до и после. Затем попытайтесь сопоставить мой «словарный файл» с этим отрывком. Я нахожусь в части 1, пробовал это, но я просто получаю сообщение ‹_sre.SRE_Match по адресу 0x028FFE78> и изо всех сил пытаюсь использовать repr: Любые предложения приветствуются или другие способы сделать это. В конечном счете, мне нужен файл экспорта, в котором есть слова из моего словаря со счетом после них, указывающим, как часто они были найдены в этом окне с моим целевым словом. Использование логики re.search основано на том, что я нашел на этой доске объявлений, поэтому я попробовал это:
input=open("Corpus.txt", "r")
matches=[]
lines=input.readlines()
for line in lines:
m=re.search(r'(\S+\s+){0,8}facility(\s+\S+){0,8}',line)
if m:
matches.append(m)
for m in matches:
output.write(str(m))
output.close()
Любая помощь приветствуется, Пол