Вопросы по теме 'diacritics'

Почему string.Compare непоследовательно обрабатывает символы с диакритическими знаками?
Если я выполню следующий оператор: string.Compare("mun", "mün", true, CultureInfo.InvariantCulture) Результат равен «-1», что указывает на то, что «мун» имеет меньшее числовое значение, чем «мюн». Однако, если я выполню этот оператор:...
4132 просмотров
schedule 22.07.2023

Удаление диакритических знаков (ñ ǹ ň ñ ṅ ņ ṇ ṋ ṉ ̈ ɲ ƞ ᶇ ɳ) из символов Unicode
Я ищу алгоритм, который может отображать символы с диакритическими знаками ( тильда , с циркумфлексом , каретка , умлаут , caron ) и их" простой "характер. Например: ń ǹ ň ñ ṅ ņ ṇ ṋ ṉ ̈ ɲ ƞ ᶇ ɳ ȵ --> n á --> a ä --> a ấ...
30846 просмотров
schedule 25.10.2023

Как выполнить фильтр, нечувствительный к регистру и диакритике для массива NSDictionaries (не NSString)?
У меня есть множество словарей. Я хотел бы отфильтровать этот массив, проверяя, содержит ли поле @ "name" каждого словаря заданную строку. Загвоздка в том, что я хотел бы сделать мою фильтрацию нечувствительной к регистру и диакритическим знакам....
2881 просмотров
schedule 27.01.2024

Код для удаления диакритических знаков с помощью ICU
Может ли кто-нибудь предоставить образец кода для удаления диакритических знаков (например, заменить символы, имеющие диакритические знаки, умляуты и т. Д., Их эквивалентами символов без акцента, без преувеличения и т. Д., Например, каждый знак é с...
5082 просмотров
schedule 03.04.2022

Как использовать сопоставление с шаблоном без учета регистра в PostgreSQL и умлаутах?
Я пытаюсь заставить PostgreSQL 8.4.3 выполнять сопоставление шаблонов без учета регистра с помощью оператора ~* , когда строки содержат символы, отличные от ASCII, такие как немецкие умляуты. База данных, терминал и все остальное настроены на...
1776 просмотров

Как выполнять запросы MySQL к тексту с умлаутами в Drupal?
Мне нужно различать узлы, начинающиеся с «О», и узлы, начинающиеся с «Ö» (о умлаут). Проблема в том, что, поскольку таблица узлов и столбец title имеют параметры сортировки utf8_general_ci, MYSQL не обрабатывает умлаут o и ö по-разному, и этот...
1236 просмотров
schedule 17.07.2022

как следует хранить данные utf8_general_ci?
я использую utf8_general_ci, как хранить данные? я имею в виду, что если у меня есть varchar/текст, который содержит специальные символы, такие как áéíóúàèìòùçÇÀÉÌÒ , они хранятся так или каким-то образом преобразуются? я выполняю поиск...
603 просмотров
schedule 03.11.2022

Символы с диакритическими знаками в именах файлов в zip-архивах
Библиотека RubyZip позволяет мне создавать имена файлов с диакритическими знаками: require 'zip/zip' Zip::ZipFile.open("my.zip", Zip::ZipFile::CREATE) { |zipfile| zipfile.get_output_stream("Café.txt") { |f| f.puts "Hello from ZipFile" } }...
554 просмотров
schedule 29.05.2023

Декодирование символов с французским акцентом для сопоставления с SQL
У меня проблема с сопоставлением символов с французским акцентом (обратите внимание, что другие символы, такие как китайский, японский, также будут использоваться). Я столкнулся с ошибкой, когда вводил французское название улицы, которое будет...
1078 просмотров
schedule 21.05.2023

Выделите символы с диакритическими знаками
Я использую подключаемый модуль jquery.highlight: http://code.google.com/p/gce-empire/source/browse/trunk/jquery.highlight.js?r=2 Когда я ищу слово с акцентом, например. "кафе", он не будет выделять совпадения "кафе"... Однако с "кафе" все...
2377 просмотров
schedule 23.06.2023

ucwords и кодировка букв с французским акцентом
У нас есть база данных канадских адресов, написанных ЗАГЛАВНЫМИ БУКВАМИ, клиент запросил преобразование в нижний регистр, за исключением первой буквы и буквы после «-». Итак, я сделал эту функцию, но у меня проблема с французскими буквами с...
4876 просмотров
schedule 18.11.2023

Как игнорировать острый акцент в совпадении регулярного выражения javascript?
Мне нужно сопоставить такое слово, как «César», для такого регулярного выражения /^cesar/i . Есть ли такая опция, как /i , чтобы настроить регулярное выражение так, чтобы оно игнорировало острые акценты ?. Или единственное решение - использовать...
20829 просмотров

Регулярное выражение Python 3 с диакритическими знаками и лигатурами,
Имена в форме: Цезарь, Юлий разделяются на Имя Юлий Фамилия Цезарь. Имена могут содержать диакритические знаки (á à é ..) и лигатуры (æ, ø). Кажется, этот код работает нормально в Python 3.3 import re def doesmatch(pat, str): try:...
748 просмотров
schedule 12.05.2023

Кодировка, которую Notepad++ просто называет ANSI, кто-нибудь знает, как ее назвать для Ruby?
У меня есть куча .txt, которые Notepad ++ говорит (в раскрывающемся меню «Кодировка») как «ANSI». В них есть немецкие символы, [äöüß], которые отлично отображаются в Notepad++. Но они не появляются прямо в irb, когда я их File.read 'this is a...
33610 просмотров

Вставьте пробел между не буквенно-цифровым и буквенно-цифровым символом, кроме определенного символа (Python)
Есть ли шанс исключить из рассмотрения некоторые юникоды (не буквенно-цифровые)? Я размечаю арабские слова, которые иногда содержат диакритические знаки, которые считаются небуквенно-цифровыми символами, но я не хочу их удалять, и мне нужно иметь...
281 просмотров
schedule 24.05.2022

проблема с кодировкой с XSS API в CQ5, à отображается как Ã�
Я использую com.adobe.granite.xss для кодирования строк в JSP. Кажется, это работает с большинством символов, кроме Ã. à отображается как Ã�. Это происходит при использовании метода xssAPI.encodeForHTML() . Я пробовал <cq:text> с...
751 просмотров
schedule 04.09.2023

Диакритические знаки Selectize.js не работают с одним символом
В моем проекте вариант diacritics не работает. Например; У меня есть İzmir , но когда я набираю İ вместо selectbox , İzmir не отображается в раскрывающемся списке. Когда я набираю I , отображается İzmir . <script> var...
762 просмотров

Как сделать ссылку на изображение в плоском файле PHP с акцентами в имени файла
Изображения не загружаются, когда я использую акценты в названии. В кодировке нет ничего плохого, но спецсимволы ломают путь к файлу. Мне просто нужны испанский и французский акценты, но мне не нравится решение замены всех символов по одному. Я...
287 просмотров
schedule 10.08.2022

Преобразование html-ввода в правильную кодировку
У меня есть html-форма с одним html-полем ввода. Ввод копируется через буфер обмена из других программ. Иногда скопированный текст не utf-8, а ansi (проверено с помощью notepad++). Затем умляуты типа ü копируются как ü . Поскольку я не хочу...
947 просмотров

Использование unique() и == для сопоставления акцентированных и неакцентированных символов
Я собираю несколько таблиц, которые выглядят почти одинаково, за исключением того, что некоторые символы в одних выделены, а в других нет. Например, «Андре» иногда читается как «Андре», «Флавио» и «Флавио» и т. д. Мне нужно рассматривать все варианты...
182 просмотров
schedule 05.03.2023