Я работаю над веб-приложением, которое позволяет нашим пользователям публиковать типичные сообщения в блогах / микроблогах / форумах, и единственная проблема, с которой мы столкнулись, заключается в том, что наши пользователи не очень часто отмечают свой контент. Поскольку теги очень важны в нашем приложении по нескольким причинам, мы хотим подтолкнуть наших пользователей к поведению тегов.
Мы внедрили хэш-теги, и это, похоже, дало некоторый эффект, и мы также намерены внедрить некоторую форму геймификации, чтобы поощрять это.
В дополнение к вышесказанному мы хотим реализовать предложения тегов (в основном то, что есть в StackOverflow). Мы хотели бы предложить теги на основе существующих тегов в нашей базе данных, а когда нет подходящих тегов, мы также хотели бы предложить теги «на ровном месте», возможно, используя какую-то библиотеку tf-idf или что-то в этом роде. Мой вопрос двоякий:
Возможно ли с точки зрения производительности сделать такой тег, предлагающий тип пользователя (т.е. при нажатии клавиши)? Я думаю, что именно так делает StackOverflow, когда вы публикуете вопрос, и мы ищем что-то очень похожее на это. Или вместо этого нам придется выполнить некоторую постобработку (т. е. после того, как пользователь уже добавил контент, мы предлагаем ему теги).
Существуют ли какие-либо инструменты/библиотеки, которые мы могли бы использовать, чтобы дать нам эти предложения, которые также дают нам определение основы и т. Д. Даже, возможно, сопоставление синонимов. Наши данные в настоящее время хранятся в MySQL, и мы также используем Hibernate Search, поэтому они также хранятся в индексах Lucene (хотя в настоящее время мы не взаимодействуем с ними напрямую, только через Hibernate Search). Мы открыты для хранения этих данных в другом типе источника данных, если это поможет ситуации.