Я работаю над программой, которая будет классифицировать файлы по группам на основе определенного текста, найденного в них. Большинство файлов, возможно, будут иметь формат .doc или .docx.
Моя программа должна уметь сравнивать список слов со словами в файлах. Я новичок в C#, и я изучаю программирование только самостоятельно, и вся эта штука с "чтением файла .doc" выходит за рамки моей головы, поэтому любая помощь будет очень признательна!
Пока что часть моего кода, связанная с офисом:
КОД
if (Path.GetExtension(listBox1.SelectedItem.ToString()) == ".doc" ||
Path.GetExtension(listBox1.SelectedItem.ToString()) == ".docx")
{
Microsoft.Office.Interop.Word.Document doc =
new Microsoft.Office.Interop.Word.Document(listBox1.SelectedItem.ToString());
doc.Activate();
}
РЕДАКТИРОВАТЬ:
Извините, если вопрос был недостаточно ясен. Мой вопрос:
Как я могу найти, содержит ли документ какие-либо определенные слова, содержащиеся в текстовом файле. Я прочитал много других вопросов, ответов и руководств, и это может быть только я, но я совершенно этого не понимаю.