В данный момент я работаю над проектом, где было бы очень полезно иметь возможность определять, когда определенная тема/идея упоминается в тексте. Например, если текст содержал:
Может быть, если вы расскажете мне немного больше о том, кто такой мистер Джонс, это поможет. Также было бы полезно, если бы у меня было описание его внешности, а еще лучше фотография?
Было бы здорово обнаружить, что человек попросил фотографию мистера Джонса. Я мог бы применить очень наивный подход и просто найти слово «фотография» или «фотография», но это, очевидно, было бы бесполезно, если бы они написали что-то вроде:
Пожалуйста, никогда не присылайте мне фото мистера Джонса.
Кто-нибудь знает, с чего начать? Это вообще возможно?
Я изучал такие вещи, как nltk, но мне еще предстоит найти пример того, как кто-то делает что-то подобное, и я до сих пор не совсем уверен, как называется этот вид анализа. Любая помощь, которая может поднять меня с земли, была бы здоровой.
Спасибо!