Вопросы по теме 'python-textprocessing'
Разбор текста в поисках данных с различными строками, выражающими основные единицы измерения (например, квадратные метры, кв.м, м^2, м2 и т. д.)
Я пытаюсь очистить номер площади (квадратные метры или квадратные футы) многих жилых домов, которые хранятся в различных текстовых файлах.
Площадь почти всегда выражается путем указания единиц либо в метрической системе (длина выражается в метрах в...
1214 просмотров
schedule
09.04.2023
Леммайнзер с использованием NLTK
У меня сейчас есть такая фраза:
text = "This is a car."
Затем я использую токенизатор, а затем выстраиваю его так:
ps = PorterStemmer()
text = word_tokenize(text)
stemmed_words = []
for w in words:
stemmed_words.append(ps.stem(w))...
118 просмотров
schedule
19.07.2022
Python — быстрое решение для удаления повторяющихся строк в 2 файлах
У меня есть два файла: файл A и файл B. Я хочу получить номера всех строк в fileB , которые существуют в fileA . Но если строка действительно находится в файле A, я не буду идентифицировать ее как «существующую в файле A», если в ней не будет и...
48 просмотров
schedule
29.02.2024
Удаление только определенных диакритических знаков из текста в Python
Мне нужно удалить некоторые диакритические знаки из текста на иврите. Если бы мне нужно было убрать из текста ВСЕ диакритические знаки, это не было бы такой проблемой.
В юникоде диапазон, который я хотел бы удалить, находится между \ u0591 и \...
124 просмотров
schedule
07.02.2022