Я подумываю о добавлении семантического анализа в свою установку Solr, но точно не знаю, с чего начать.
По сути, я бы хотел, чтобы Solr мог находить «похожие» слова (взятые из тела проиндексированных документов). Например, если я ищу «музыка», я должен иметь возможность запросить семантический движок и получить «рок», «поп» и т. д. (конечно, если эти слова появляются рядом с музыкой в некоторых проиндексированных документах).
Я нашел этот проект, но не знаю, с чего начать: http://code.google.com/p/semanticvectors/