Как я могу получить текст из документа Open Office?
Я использую OO для преобразования файлов MS Word и Excel в формат PDF для отображения на веб-странице. Но в некоторых случаях можно столкнуться с поврежденными файлами, и поврежденные файлы открываются как очень большие xml.
Чтобы решить эту проблему, я собираюсь получить первую строку содержимого, и, если существует тег xml, предложить пользователю загрузить документ и попытаться восстановить или открыть его в MS Word. Но подробной документации и примеров работы с текстом я не нашел.