Учитывая абзац, я хочу разбить его на предложения. На данный момент я просто делаю это:
var sentences = paragraph.split('.');
Он работает по большей части, однако начинает давать сбой, когда ему дается такое предложение:
Аляска — самый большой штат США.
Поскольку U.S.
имеет точки, он анализирует S
как предложение.
Как лучше всего определить предложения в абзаце? Я думал о том, чтобы разобрать их на основе последней точки перед заглавной буквой, но если абзац плохо напечатан (строчная буква после точки), он также не будет работать на этом
split('.\s+')
? (Хотя я придерживаюсь второго предложения дистроя, синтаксический анализ языка/грамматики регулярных выражений неудобен). - person David says reinstate Monica   schedule 26.05.2013\s+
не совсем подходит. - person mu is too short   schedule 26.05.2013