Я пытаюсь извлечь иерархию информации в файлах ODP (презентация OpenDocument): заголовки, субтитры, основной текст...
Знаете ли вы какой-нибудь инструмент или технику, которая могла бы выполнить эту работу?
В противном случае, есть ли способ проанализировать эти документы ODP, чтобы извлечь информацию о стилях? Так что позже я могу определить структуру документа по его стилю.
Я боюсь, что структура файла XML внутри файла ODP может зависеть от программного обеспечения или версии. Так что я бы предпочел найти решение высокого уровня, чем анализировать этот XML-файл напрямую.