Используя С#, мне нужно извлечь данные из документа Word. У меня в проекте установлен NetOffice for word. Данные состоят из двух частей.
Во-первых, мне нужно вытащить данные из настроек документа.
Во-вторых, мне нужно вытащить содержимое элементов управления в документе. Содержимое полей включает флажки, дату и несколько абзацев. Метод ввода — через элементы управления, поэтому должен быть какой-то способ взаимодействия с элементами управления через API, но я не знаю, как это сделать.
прямо сейчас у меня есть следующий код для извлечения плоского текста из документа:
private static string wordDocument2String(string file)
{
NetOffice.WordApi.Application wordApplication = new NetOffice.WordApi.Application();
NetOffice.WordApi.Document newDocument = wordApplication.Documents.Open(file);
string txt = newDocument.Content.Text;
wordApplication.Quit();
wordApplication.Dispose();
return txt;
}
Итак, вопрос: как мне вытащить данные из элементов управления из документа, и как мне вытащить настройки документа (например, заголовок, автор и т. д., как видно из слова), используя либо NetOffice, либо какой-либо другой пакет ?