Зачем в NFD есть NFC; [:Отметка без пробелов:] Удалить; NFC?

На http://userguide.icu-project.org/transforms/general можно читать

чтобы удалить акценты с символов, используйте следующее преобразование:

NFD; [:Nonspacing Mark:] Remove; NFC.

Это преобразование отделяет акценты от их основных символов, удаляет акценты, а затем переводит оставшийся текст в неакцентированную форму.

NFD выполняет каноническую декомпозицию, так зачем же нужно перекомпоновывать после удаления меток без пробелов?


person MatTheCat    schedule 22.02.2019    source источник


Ответы (1)


Итак, каноническая декомпозиция не ограничивается диакритическими знаками; Мне дали пример слогов хангыль, которые можно разделить на множество джамо. Тогда может иметь смысл перекомпоновать такие символы.

person MatTheCat    schedule 25.02.2019