Я пытаюсь разбить предложения на куски, используя RegEx в слове «но» (или любых других координирующих словах союза). Это не работает...
sentence = nltk.pos_tag(word_tokenize("There are no large collections present but there is spinal canal stenosis."))
result = nltk.RegexpParser(grammar).parse(sentence)
DigDug = nltk.RegexpParser(r'CHUNK: {.*<CC>.*}')
for subtree in DigDug.parse(sentence).subtrees():
if subtree.label() == 'CHUNK': print(subtree.node())
Мне нужно разделить предложение "There are no large collections present but there is spinal canal stenosis."
на два:
1. "There are no large collections present"
2. "there is spinal canal stenosis."
Я также хочу использовать тот же код для разделения предложений на «и» и других словах сочинительного союза (CC). Но мой код не работает. Пожалуйста помоги.