Вопросы по теме 'diacritics'
Почему string.Compare непоследовательно обрабатывает символы с диакритическими знаками?
Если я выполню следующий оператор:
string.Compare("mun", "mün", true, CultureInfo.InvariantCulture)
Результат равен «-1», что указывает на то, что «мун» имеет меньшее числовое значение, чем «мюн».
Однако, если я выполню этот оператор:...
4132 просмотров
schedule
22.07.2023
Удаление диакритических знаков (ñ ǹ ň ñ ṅ ņ ṇ ṋ ṉ ̈ ɲ ƞ ᶇ ɳ) из символов Unicode
Я ищу алгоритм, который может отображать символы с диакритическими знаками ( тильда , с циркумфлексом , каретка , умлаут , caron ) и их" простой "характер.
Например:
ń ǹ ň ñ ṅ ņ ṇ ṋ ṉ ̈ ɲ ƞ ᶇ ɳ ȵ --> n
á --> a
ä --> a
ấ...
30846 просмотров
schedule
25.10.2023
Как выполнить фильтр, нечувствительный к регистру и диакритике для массива NSDictionaries (не NSString)?
У меня есть множество словарей. Я хотел бы отфильтровать этот массив, проверяя, содержит ли поле @ "name" каждого словаря заданную строку.
Загвоздка в том, что я хотел бы сделать мою фильтрацию нечувствительной к регистру и диакритическим знакам....
2881 просмотров
schedule
27.01.2024
Код для удаления диакритических знаков с помощью ICU
Может ли кто-нибудь предоставить образец кода для удаления диакритических знаков (например, заменить символы, имеющие диакритические знаки, умляуты и т. Д., Их эквивалентами символов без акцента, без преувеличения и т. Д., Например, каждый знак é с...
5082 просмотров
schedule
03.04.2022
Как использовать сопоставление с шаблоном без учета регистра в PostgreSQL и умлаутах?
Я пытаюсь заставить PostgreSQL 8.4.3 выполнять сопоставление шаблонов без учета регистра с помощью оператора ~* , когда строки содержат символы, отличные от ASCII, такие как немецкие умляуты. База данных, терминал и все остальное настроены на...
1776 просмотров
schedule
15.02.2022
Как выполнять запросы MySQL к тексту с умлаутами в Drupal?
Мне нужно различать узлы, начинающиеся с «О», и узлы, начинающиеся с «Ö» (о умлаут).
Проблема в том, что, поскольку таблица узлов и столбец title имеют параметры сортировки utf8_general_ci, MYSQL не обрабатывает умлаут o и ö по-разному, и этот...
1236 просмотров
schedule
17.07.2022
как следует хранить данные utf8_general_ci?
я использую utf8_general_ci, как хранить данные?
я имею в виду, что если у меня есть varchar/текст, который содержит специальные символы, такие как áéíóúàèìòùçÇÀÉÌÒ , они хранятся так или каким-то образом преобразуются? я выполняю поиск...
603 просмотров
schedule
03.11.2022
Символы с диакритическими знаками в именах файлов в zip-архивах
Библиотека RubyZip позволяет мне создавать имена файлов с диакритическими знаками:
require 'zip/zip'
Zip::ZipFile.open("my.zip", Zip::ZipFile::CREATE) { |zipfile|
zipfile.get_output_stream("Café.txt") { |f| f.puts "Hello from ZipFile" }
}...
554 просмотров
schedule
29.05.2023
Декодирование символов с французским акцентом для сопоставления с SQL
У меня проблема с сопоставлением символов с французским акцентом (обратите внимание, что другие символы, такие как китайский, японский, также будут использоваться).
Я столкнулся с ошибкой, когда вводил французское название улицы, которое будет...
1078 просмотров
schedule
21.05.2023
Выделите символы с диакритическими знаками
Я использую подключаемый модуль jquery.highlight: http://code.google.com/p/gce-empire/source/browse/trunk/jquery.highlight.js?r=2
Когда я ищу слово с акцентом, например. "кафе", он не будет выделять совпадения "кафе"... Однако с "кафе" все...
2377 просмотров
schedule
23.06.2023
ucwords и кодировка букв с французским акцентом
У нас есть база данных канадских адресов, написанных ЗАГЛАВНЫМИ БУКВАМИ, клиент запросил преобразование в нижний регистр, за исключением первой буквы и буквы после «-».
Итак, я сделал эту функцию, но у меня проблема с французскими буквами с...
4876 просмотров
schedule
18.11.2023
Как игнорировать острый акцент в совпадении регулярного выражения javascript?
Мне нужно сопоставить такое слово, как «César», для такого регулярного выражения /^cesar/i .
Есть ли такая опция, как /i , чтобы настроить регулярное выражение так, чтобы оно игнорировало острые акценты ?. Или единственное решение - использовать...
20829 просмотров
schedule
12.01.2022
Регулярное выражение Python 3 с диакритическими знаками и лигатурами,
Имена в форме: Цезарь, Юлий разделяются на Имя Юлий Фамилия Цезарь.
Имена могут содержать диакритические знаки (á à é ..) и лигатуры (æ, ø).
Кажется, этот код работает нормально в Python 3.3
import re
def doesmatch(pat, str):
try:...
748 просмотров
schedule
12.05.2023
Кодировка, которую Notepad++ просто называет ANSI, кто-нибудь знает, как ее назвать для Ruby?
У меня есть куча .txt, которые Notepad ++ говорит (в раскрывающемся меню «Кодировка») как «ANSI».
В них есть немецкие символы, [äöüß], которые отлично отображаются в Notepad++.
Но они не появляются прямо в irb, когда я их File.read 'this is a...
33610 просмотров
schedule
15.12.2022
Вставьте пробел между не буквенно-цифровым и буквенно-цифровым символом, кроме определенного символа (Python)
Есть ли шанс исключить из рассмотрения некоторые юникоды (не буквенно-цифровые)? Я размечаю арабские слова, которые иногда содержат диакритические знаки, которые считаются небуквенно-цифровыми символами, но я не хочу их удалять, и мне нужно иметь...
281 просмотров
schedule
24.05.2022
проблема с кодировкой с XSS API в CQ5, à отображается как Ã�
Я использую com.adobe.granite.xss для кодирования строк в JSP. Кажется, это работает с большинством символов, кроме Ã. à отображается как Ã�.
Это происходит при использовании метода xssAPI.encodeForHTML() . Я пробовал <cq:text> с...
751 просмотров
schedule
04.09.2023
Диакритические знаки Selectize.js не работают с одним символом
В моем проекте вариант diacritics не работает. Например; У меня есть İzmir , но когда я набираю İ вместо selectbox , İzmir не отображается в раскрывающемся списке. Когда я набираю I , отображается İzmir .
<script>
var...
762 просмотров
schedule
06.11.2022
Как сделать ссылку на изображение в плоском файле PHP с акцентами в имени файла
Изображения не загружаются, когда я использую акценты в названии. В кодировке нет ничего плохого, но спецсимволы ломают путь к файлу.
Мне просто нужны испанский и французский акценты, но мне не нравится решение замены всех символов по одному. Я...
287 просмотров
schedule
10.08.2022
Преобразование html-ввода в правильную кодировку
У меня есть html-форма с одним html-полем ввода. Ввод копируется через буфер обмена из других программ. Иногда скопированный текст не utf-8, а ansi (проверено с помощью notepad++). Затем умляуты типа ü копируются как ü . Поскольку я не хочу...
947 просмотров
schedule
06.11.2022
Использование unique() и == для сопоставления акцентированных и неакцентированных символов
Я собираю несколько таблиц, которые выглядят почти одинаково, за исключением того, что некоторые символы в одних выделены, а в других нет. Например, «Андре» иногда читается как «Андре», «Флавио» и «Флавио» и т. д. Мне нужно рассматривать все варианты...
182 просмотров
schedule
05.03.2023