Вопросы по теме 'pdf-conversion'
itextsharp PdfTextExtractor Неправильное написание слов
В нашей базе данных есть файл PDF в двоичном формате. Я выложил его в потоковом режиме и сохранил как файл PDF, протестировал с обоими источниками и получил тот же результат: PdfTextExtractor неправильно произносит некоторые слова.
Например, в...
1547 просмотров
schedule
24.04.2022
PDFCreator и средство просмотра Excel
Я хотел бы использовать PDFCreator для создания файлов PDF из файлов Excel (.xlsx). Я не могу использовать MS Office.
Я скачал PDFCreator и попытался распечатать .docx с помощью команды:
PDFCreator.exe /PF"myfile.docx"
С этим проблем нет,...
2982 просмотров
schedule
06.03.2024
Проблемы с преобразованием docx в pdf с помощью docx4j
Я использую docx4j 2.8.1 и пытался преобразовать несколько разных файлов docx, но у меня всегда одна и та же проблема. возможно, проблема связана с версией библиотеки или отсутствием какой-либо зависимости.
Код:
package test;
import...
4025 просмотров
schedule
15.12.2023
xmlWorker усекает таблицы внутри DIV
Я использую последнюю версию xmlWorker (5.4.3) для преобразования файла XHTML в PDF . Когда TABLE TAG находится внутри DIV TAG и таблица превышает страницу, таблица усекается...
Мне это кажется очень странным. Или нет?
Есть идеи?
693 просмотров
schedule
25.07.2022
Dompdf отлично конвертируется на локальном, но не на рабочем сервере
Я использую Laravel 4 с пакетом dompdf: https://github.com/barryvdh/laravel-dompdf
Когда я создаю отчет и он преобразует его в PDF на моем локальном компьютере, все в порядке и отображается хорошо, но когда я делаю то же самое на своем рабочем...
1834 просмотров
schedule
01.05.2024
Текстовый редактор Ghostscript сохраняет пустые строки
Я пытаюсь преобразовать PDF-файлы в текстовые файлы. Я использую эту команду для выполнения преобразования:
gs -dBATCH -dNOPAUSE -sDEVICE=txtwrite -sOutputFile=output.txt input.pdf
Версия Ghostscript 9.07.
Я получаю весь текст, показанный...
153 просмотров
schedule
17.01.2023
Преобразование pdf-документа, который включает таблицы в файл csv, с использованием python или любого другого языка
Я попытался преобразовать документ pdf (включая таблицы) в файл csv. К сожалению, я потерпел неудачу. Я использовал следующие подходы:
Используемый pdfminer сначала преобразовал pdf в текст, но структура текстового файла не такая, как у...
771 просмотров
schedule
18.01.2022
org.apache.poi.xwpf.converter.core.XWPFConverterException: java.lang.NullPointerException (Java)
Я получаю сообщение об ошибке конвертации при конвертации docx в pdf.
Это мой код:
private File convertFileToPdf(MultipartFile file) {
try {
File docFile = new File(file.getOriginalFilename());
String extension =...
908 просмотров
schedule
04.10.2023
Как читать таблицу?
У меня есть расписание в формате PDF.
(1) (2) (3)
09:00 10:30 11:30
Monday 12C 11B 10A
Tuesday 10K 10K 9A
Wednesday 7A
Thursday 7B 7B
Friday 6A...
122 просмотров
schedule
23.03.2024
Преобразование файла .docx в pdf с использованием изображений apache poi
У меня есть текстовый документ .docx, содержащий таблицы, абзацы и изображения. Мне удалось успешно преобразовать файл в pdf, но в файле pdf отсутствуют изображения. Это фрагмент кода, который я использую:
ByteArrayOutputStream baos = new...
1211 просмотров
schedule
23.12.2022
Заполняемое преобразование PDF в XML в MarkLogic
Я загрузил несколько файлов PDF в MarkLogic с помощью MLCP, которые затем были преобразованы в XML с помощью преобразования PDF по умолчанию CPF. Некоторые из PDF-файлов можно было заполнить, но ни один из заполненных материалов не был включен в...
83 просмотров
schedule
27.11.2022
Объединение нескольких страниц PDF в одностраничный PDF
Итак, у меня есть многостраничный PDF-файл, который выглядит примерно так
многостраничный
В настоящее время это более одной страницы, но я хотел бы объединить. Эти две страницы должны быть объединены таким образом, чтобы они стали одной...
216 просмотров
schedule
15.09.2023
Я пытаюсь извлечь данные в виде элементов HTML в python, используя pdfminer.
Я пытаюсь извлечь данные в виде HTML из pdf с помощью pdfminer, хотя мне удалось извлечь текст из того же pdf, теперь я получаю сообщение об ошибке при извлечении данных в формате HTML. Мне нужно дополнительно отфильтровать данные, чтобы...
505 просмотров
schedule
26.05.2023
Команда не найдена в вашем пути к классам.
Я использую wkhtmltopdf в своем приложении Java, и когда я пытаюсь отправить HTTP-запрос, я получаю, что команда wkhtmltopdf не найдена в вашем пути к классам. Проверьте его установку или инициализируйте конфигурации оболочки с правильной...
69 просмотров
schedule
15.02.2023