Я попытался преобразовать документ pdf (включая таблицы) в файл csv. К сожалению, я потерпел неудачу. Я использовал следующие подходы:
Используемый
pdfminer
сначала преобразовал pdf в текст, но структура текстового файла не такая, как у файла pdf.Используемый
pypdf2
сначала преобразовал pdf в текст, но структура текстового файла не такая, как у файла pdf.Используемый
pdftotext
сначала преобразовал PDF в текст, но структура текстового файла не такая, как у файла PDF.Используемый
slate
сначала преобразовал pdf в текст, но структура текстового файла не такая, как у файла pdf.
Пожалуйста, подскажите подходящий способ конвертировать PDF в файл CSV. Некоторые люди рекомендовали мне преобразовать документ в файл xml, а затем в файл csv. Даже тогда у меня не было решения.
Документ PDF выглядит следующим образом:
Есть ли лучшие инструменты, которые могут конвертировать PDF-документ (включая сложные таблицы) в CSV-файл?
Мы будем очень благодарны за решения на языке Python.