Я искал в Google, но не нашел никакой подсказки, связанной с реализацией анализатора в Xapian, даже Xapian может не поддерживать использование анализатора, такого как lucene. Другими словами, я не могу расширить поддержку на китайском языке. Я прав?
Я искал в Xapian C++ API, нашел только TermGenerator, который может быть связан с извлечением слова . Существует флаг с именем FLAG_CJK_NGRAM
, он может разбить слово CJK UTF-8, скажем, ABCD, он разделит его на AB, BC, CD и A, B, C, D. Это очень просто и понятно. Я полагаю, мне нужно более точное решение, кажется, мне нужно внедрить или перенести зрелое решение (например, jieba) к Хапиану. Я прав?