Вопросы по теме 'punctuation'

Существуют ли коллекции символов для всех международных точек препинания?
Я пытаюсь разобрать строки utf-8 на сегменты "размера укуса". Например, я хотел бы разбить текст на «предложения». Существует ли полный набор символов (или регулярных выражений), соответствующих концу предложений на всех языках? Я ищу что-то, что...
1413 просмотров

Удаление пунктуации из уникальных строк во входном файле
Этот вопрос ( Лучший способ удалить знаки препинания из строки в Python ) занимается удалением пунктуации из отдельной строки. Однако я надеюсь прочитать текст из входного файла, но распечатать только ОДНУ КОПИЮ всех строк без окончания...
359 просмотров
schedule 04.02.2023

Проверить, является ли строка знаком пунктуации
Скажем, у меня есть массив строк, содержащий буквы и знаки препинания. String letter[] = {"a","b","c",".","a"}; В букве [3] у нас есть "." Как я могу проверить, является ли строка знаком пунктуации? Мы знаем, что существует множество...
62135 просмотров
schedule 18.11.2023

Полные остановки в заголовке недоступны для поиска в SOLR.
У меня есть довольно простая реализация поиска SOLR с использованием DataImportHandler. Одним из полей является название компании. Он создает поле для поиска с названием компании как его частью, а также описанием. Дело в том, что поиск компании...
46 просмотров
schedule 21.12.2023

Microsoft Speech Platform: SPF_NLP_SPEAK_PUNC не работает
Я использую Speech Platform для TTS (преобразование текста в речь). Я хочу получить речевые выходы с произношением символов (знаков препинания). MSDN говорит: ISpVoice::Speak speaks the contents of a text string or file. HRESULT Speak(...
513 просмотров

Регулярное выражение и просмотр вперед: java
Я пытаюсь удалить пунктуацию кроме точек (чтобы сохранить структуру предложения) из строки с регулярным выражением. На самом деле, я понятия не имею, как это работает, я просто кодирую это: public static String removePunctuation(String s){...
85 просмотров
schedule 30.01.2024

regex remove punct удаляет не пунктуационные символы в R
При фильтрации и очистке текста на иврите я обнаружил, что gsub("[[:punct:]]", "", txt) фактически удаляет соответствующий символ. Символ «ק» расположен в месте «E» на клавиатуре. Интересно, что функция gsub в R удаляет символ «ק», после...
138 просмотров
schedule 14.12.2023

Как удалить все начальные и конечные знаки препинания в Python?
Я знаю, как удалить все знаки препинания в строке. import string s = '.$ABC-799-99,#' table = string.maketrans("","") # to remove punctuation new_s = s.translate(table, string.punctuation) print(new_s) # Output ABC79999 Как удалить все...
13106 просмотров
schedule 17.04.2024

Пунктуация IBM Watson SpeechToText
Я новичок в IBM Watson SpeechToText, и мне нужно использовать его в проекте, но я заметил, что в возвращаемой транскрипции нет знаков препинания. Я включил интеллектуальное форматирование, но оно не работает. Какие-либо предложения? Для...
306 просмотров
schedule 04.02.2022

Удаление дефисов в http, но сохранение дефисных слов в корпусе
Я пытаюсь модифицировать функцию определения основы, которая может 1) удалять дефисы в http (которые появились в корпусе), но при этом 2) сохранять дефисы, которые появляются в значимых дефисных выражениях (например, отнимающих много времени,...
50 просмотров
schedule 20.05.2024

Как правильно добавить полужирный шрифт или курсив к точке предложения в уценке
Каждый раз, когда я пишу Markdown и нахожусь в конце предложения, и мне нужно закончить предложение словом жирным или курсивом , я не знаю, следует ли мне включать точку или нет. Я видел Markdown документов как с точкой, так и без нее. Вот...
165 просмотров
schedule 11.07.2023