В моем приложении (С#) мне нужно фильтровать электронные письма на основе их содержимого. Если электронное письмо является двойным выбором, необходимо отправить его на указанный адрес электронной почты, если это обычное электронное письмо, я должен отправить его на другой адрес электронной почты.
Я просмотрел приходящие электронные письма и составил список общих слов, которые появляются в теме писем с двойной подпиской (максимум 10–20 слов). Для каждого пришедшего электронного письма я проверял, содержит ли тема некоторые слова, и если их было больше 2-3, в зависимости от длины темы, я решил, что это подписка. Проблема заключалась в том, что эта базовая версия не работала должным образом.
Я читал о спам-фильтрах (в основном то, что я хочу сделать, похоже). И после поиска некоторых примеров в Интернете я нашел некоторые из них, основанные на байесовских сетях. Проблема с этим решением заключается в том, что мне нужно было ввести много учебного материала, которого у меня еще нет.
Как я могу фильтровать эти электронные письма на основе содержания + темы или просто темы, не нуждаясь в большом количестве учебных материалов?
EDIT: я хочу выполнить фильтрацию на уровне сервера электронной почты.