Вопросы по теме 'text-segmentation'

Как использовать НЛП для разделения неструктурированного текстового содержимого на отдельные абзацы?
Следующий неструктурированный текст имеет три отдельные темы — Сталлоне, Филадельфия и Американская революция. Но какой алгоритм или метод вы бы использовали, чтобы разделить этот контент на отдельные абзацы? Классификаторы в этом случае не...
3274 просмотров

Как разделить слова в предложении пробелами?
Задний план Хотите автоматизировать создание доменов в JasperServer. Домены — это «представление» данных для создания специальных отчетов. Имена столбцов должны быть представлены пользователю в удобочитаемом виде. Проблема Существует более...
1967 просмотров
schedule 26.02.2023

Обнаружение предложений с использованием NLP
Я пытаюсь разбирать предложения из огромного количества текста. Используя java, я начал с таких инструментов NLP, как OpenNLP и Stanford's Parser. Но здесь я застреваю. хотя оба этих парсера довольно хороши, они терпят неудачу, когда дело доходит...
5121 просмотров
schedule 30.08.2023

Проверка возможности сегментации слов
Это дополнительный вопрос к этот ответ и алгоритм псевдокода, опубликованный пользователем. Я не комментировал этот вопрос из-за его возраста. Меня интересует только проверка того, можно ли разбить строку на слова. Алгоритму не нужно на самом...
1796 просмотров

Разделение абзацев на предложения
Учитывая абзац, я хочу разбить его на предложения. На данный момент я просто делаю это: var sentences = paragraph.split('.'); Он работает по большей части, однако начинает давать сбой, когда ему дается такое предложение: Аляска —...
952 просмотров
schedule 02.07.2023

Как улучшить сегментацию предложений NLTK?
У меня есть этот текст из Википедии: Амбициозный план расширения кампуса был предложен о. Вернон Ф. Галлахер в 1952 году. Успенский зал, первое студенческое общежитие, был открыт в 1954 году, а Рокуэлл-холл был открыт в ноябре 1958 года, в нем...
4195 просмотров
schedule 27.10.2022

Сегмент рукописного текста в отсортированном порядке
Я пытаюсь создать рукописную текстовую систему для сравнения каждого текста, как они различаются друг с другом. Мне нужно извлечь сегмент строки, чтобы создать каждое изображение для каждого текста, а затем продолжить работу для различия изображений....
112 просмотров