Вопросы по теме 'punctuation'
Существуют ли коллекции символов для всех международных точек препинания?
Я пытаюсь разобрать строки utf-8 на сегменты "размера укуса". Например, я хотел бы разбить текст на «предложения».
Существует ли полный набор символов (или регулярных выражений), соответствующих концу предложений на всех языках? Я ищу что-то, что...
1413 просмотров
schedule
17.12.2022
Удаление пунктуации из уникальных строк во входном файле
Этот вопрос ( Лучший способ удалить знаки препинания из строки в Python ) занимается удалением пунктуации из отдельной строки. Однако я надеюсь прочитать текст из входного файла, но распечатать только ОДНУ КОПИЮ всех строк без окончания...
359 просмотров
schedule
04.02.2023
Проверить, является ли строка знаком пунктуации
Скажем, у меня есть массив строк, содержащий буквы и знаки препинания.
String letter[] = {"a","b","c",".","a"};
В букве [3] у нас есть "."
Как я могу проверить, является ли строка знаком пунктуации? Мы знаем, что существует множество...
62135 просмотров
schedule
18.11.2023
Полные остановки в заголовке недоступны для поиска в SOLR.
У меня есть довольно простая реализация поиска SOLR с использованием DataImportHandler. Одним из полей является название компании. Он создает поле для поиска с названием компании как его частью, а также описанием.
Дело в том, что поиск компании...
46 просмотров
schedule
21.12.2023
Microsoft Speech Platform: SPF_NLP_SPEAK_PUNC не работает
Я использую Speech Platform для TTS (преобразование текста в речь).
Я хочу получить речевые выходы с произношением символов (знаков препинания).
MSDN говорит:
ISpVoice::Speak speaks the contents of a text string or file.
HRESULT Speak(...
513 просмотров
schedule
11.05.2024
Регулярное выражение и просмотр вперед: java
Я пытаюсь удалить пунктуацию кроме точек (чтобы сохранить структуру предложения) из строки с регулярным выражением. На самом деле, я понятия не имею, как это работает, я просто кодирую это:
public static String removePunctuation(String s){...
85 просмотров
schedule
30.01.2024
regex remove punct удаляет не пунктуационные символы в R
При фильтрации и очистке текста на иврите я обнаружил, что
gsub("[[:punct:]]", "", txt)
фактически удаляет соответствующий символ. Символ «ק» расположен в месте «E» на клавиатуре. Интересно, что функция gsub в R удаляет символ «ק», после...
138 просмотров
schedule
14.12.2023
Как удалить все начальные и конечные знаки препинания в Python?
Я знаю, как удалить все знаки препинания в строке.
import string
s = '.$ABC-799-99,#'
table = string.maketrans("","") # to remove punctuation
new_s = s.translate(table, string.punctuation)
print(new_s)
# Output
ABC79999
Как удалить все...
13106 просмотров
schedule
17.04.2024
Пунктуация IBM Watson SpeechToText
Я новичок в IBM Watson SpeechToText, и мне нужно использовать его в проекте, но я заметил, что в возвращаемой транскрипции нет знаков препинания. Я включил интеллектуальное форматирование, но оно не работает. Какие-либо предложения?
Для...
306 просмотров
schedule
04.02.2022
Удаление дефисов в http, но сохранение дефисных слов в корпусе
Я пытаюсь модифицировать функцию определения основы, которая может 1) удалять дефисы в http (которые появились в корпусе), но при этом 2) сохранять дефисы, которые появляются в значимых дефисных выражениях (например, отнимающих много времени,...
50 просмотров
schedule
20.05.2024
Как правильно добавить полужирный шрифт или курсив к точке предложения в уценке
Каждый раз, когда я пишу Markdown и нахожусь в конце предложения, и мне нужно закончить предложение словом жирным или курсивом , я не знаю, следует ли мне включать точку или нет. Я видел Markdown документов как с точкой, так и без нее.
Вот...
165 просмотров
schedule
11.07.2023