Вопросы по теме 'python-textprocessing'

Разбор текста в поисках данных с различными строками, выражающими основные единицы измерения (например, квадратные метры, кв.м, м^2, м2 и т. д.)
Я пытаюсь очистить номер площади (квадратные метры или квадратные футы) многих жилых домов, которые хранятся в различных текстовых файлах. Площадь почти всегда выражается путем указания единиц либо в метрической системе (длина выражается в метрах в...
1214 просмотров

Леммайнзер с использованием NLTK
У меня сейчас есть такая фраза: text = "This is a car." Затем я использую токенизатор, а затем выстраиваю его так: ps = PorterStemmer() text = word_tokenize(text) stemmed_words = [] for w in words: stemmed_words.append(ps.stem(w))...
118 просмотров
schedule 19.07.2022

Python — быстрое решение для удаления повторяющихся строк в 2 файлах
У меня есть два файла: файл A и файл B. Я хочу получить номера всех строк в fileB , которые существуют в fileA . Но если строка действительно находится в файле A, я не буду идентифицировать ее как «существующую в файле A», если в ней не будет и...
48 просмотров

Удаление только определенных диакритических знаков из текста в Python
Мне нужно удалить некоторые диакритические знаки из текста на иврите. Если бы мне нужно было убрать из текста ВСЕ диакритические знаки, это не было бы такой проблемой. В юникоде диапазон, который я хотел бы удалить, находится между \ u0591 и \...
124 просмотров