Я хочу загрузить документы MS Office Word / Excel в Marklogic и запросить их с помощью xquery, как это сделано с документами xml. Но когда я загружаю файлы документов в Marklogic, он загружает их в двоичный формат и показывает ненужные символы при просмотре с помощью консоли запросов. Я попытался загрузить с помощью следующей команды: -
xdmp:document-load("E:\doc\sample.doc",
<options xmlns="xdmp:document-load"
xmlns:http="xdmp:http">
<format>xml</format>
</options>)
Но он показывает ошибку, в которой говорится, что документ не закодирован в UTF 8. Я хочу знать, можно ли загружать файлы doc и xls как есть в Marklogic или их нужно преобразовать в формат XML или UTF 8 Encoded перед их загрузкой. Если да, то каков процесс их преобразования. Если нет, то как мы можем запросить их с помощью xquery. Я также хочу знать, необходима ли установка MS Office 2007/2010 для процесса преобразования, потому что и Office 2007, и 2010 поддерживают формат OOXML.
Пожалуйста, дайте мне правильные указания по этому поводу.