В настоящее время я работаю над проектом, в котором я принимаю электронные письма, удаляю тела сообщений с помощью пакета электронной почты, а затем хочу классифицировать их, используя такие ярлыки, как спорт, политика, технологии и т. Д.
Я успешно удалил тела сообщений из своих электронных писем, теперь я хочу начать классифицировать. Я сделал классический пример классификации анализа настроений, используя корпус move_reviews, разделяющий документы на положительные и отрицательные отзывы.
Мне просто интересно, как я могу применить этот подход к моему проекту? Могу ли я создать несколько классов, таких как спорт, технологии, политика, развлечения и т. д.? Я столкнулся с препятствием здесь и ищу толчок в правильном направлении.
Если это не подходящий вопрос для SO, я с радостью удалю его.
Редактировать: Всем привет, я вижу, что этот пост стал немного популярнее, я успешно завершил этот проект, вот ссылка на код в GitHub Repo проектов: https://github.com/codyreandeau/Email-Categorizer/blob/master/Email_Categorizer.py