У меня есть файл в кодировке utf-8, содержащий арабский текст, и мне нужно его найти.
Моя проблема - диакритические знаки, как искать, пропуская их?
Например, если вы загружаете этот текст в Internet Explorer (конечно, конвертируя текст в HTML), IE пропускает эти диакритические знаки?
Любая помощь?
Edit1: поиск просто выполняется с помощью следующего кода:
var m1 : TMemo; //contains utf-8 data)
m2 : TMemo; // contains results
...
m2.lines.BeginUpdate;
for s in m1.Lines do
begin
if pos(eSearch.Text,s)>0 then
begin
m2.Lines.Add(s);
end;
end;
m2.Lines.EndUpdate;
Edit2: пример данных Unicode:
قُلْ هُوَ اللَّهُ أَحَدٌ Если искать только буквы без диакритических знаков قل, слово قُلْ не будет найдено.