Я хочу разобрать слова из текстового файла. Апострофы должны быть сохранены, но одинарные кавычки должны быть удалены. Вот некоторые тестовые данные:
john's apostrophe is a 'challenge'
Я экспериментирую с grep следующим образом:
grep -o "[a-z'A-Z]*" file.txt
и он производит:
john's
apostrophe
is
a
'challenge'
Нужно избавиться от этих кавычек вокруг слова challenge
.
Правильный/желаемый вывод должен быть:
john's
apostrophe
is
a
challenge
РЕДАКТИРОВАТЬ: Поскольку консенсус, похоже, заключается в том, что апострофы проблематично распознавать, теперь я ищу способ удалить любой апостроф (начальный, конечный, встроенный) из всех слов. Слова должны быть добавлены к словарному указателю. Поиск по фразе также должен удалять апострофы. Для этого может понадобиться еще один вопрос.