Мне нужно классифицировать текст, и я использую для этого модуль Python Text blob. Я могу использовать либо наивный байесовский классификатор / дерево решений. Меня беспокоят указанные ниже моменты.
1) Мне нужно классифицировать предложения как аргумент / не аргумент. Я использую два классификатора и обучаю модель с использованием подходящих наборов данных. Мой вопрос заключается в том, нужно ли мне тренировать модель только с ключевыми словами? или я могу обучить набор данных со всеми возможными аргументами и без аргументов примерами предложений? Какой подход был бы наилучшим с точки зрения точности классификации текста и времени на извлечение?
2) Поскольку классификация будет либо аргументом, либо не аргументом, какой классификатор даст точные результаты? Это Наивный Байес / Дерево решений / Позитивный Наивный Байес?
Заранее спасибо.