Вопросы по теме 'pdfbox'
Как получить текст и форматирование из таблицы PDF с помощью PDFBox?
Возможный дубликат: Анализ файлов PDF (особенно с таблицами) с PDFBox
Я использую PDFBox для анализа текста с помощью C # из файла PDF. Это нормально работает, но когда парсер сталкивается с таблицей, он разбирает текст и разрушает...
947 просмотров
schedule
14.05.2023
Построить PDFBox FAILURE в jempbox
Я обнаружил, что pdfbox-1.6.0.jar не работает в моей системе, поэтому я попытался собрать его из исходного кода и установил Maven.
Я получил эту ошибку при сборке в Windows XP или Fedora 15:
Tests run: 8, Failures: 1, Errors: 0, Skipped: 0,...
256 просмотров
schedule
24.04.2023
PDFBox не распознает ссылку
Я использую Apache PDFBox для сканирования PDF-файлов в поисках ссылок на определенный файл.
Мне нужно отсканировать около тысячи PDF-файлов, и большинство ссылок (фактически все, кроме одной, насколько я вижу сейчас) найдены.
Однако в...
1277 просмотров
schedule
07.10.2022
PDFBox извлечение абзацев
Я новичок в pdfbox и хочу извлечь абзац, который соответствует некоторым конкретным словам, и я могу извлечь весь pdf в текст (блокнот), но я понятия не имею, как извлечь конкретный абзац в мою программу Java. Может ли кто-нибудь помочь мне с этим,...
13904 просмотров
schedule
18.11.2023
Pdfbox как извлечь тип и стиль шрифта из pdf
Как получить атрибуты стиля шрифта из pdf с помощью pdfbox
3621 просмотров
schedule
30.04.2022
Как обрезать каждую страницу в формате PDF с помощью PDFBOX в Java?
Я хочу удалить нижнюю часть каждой страницы в PDF, но не изменить размер страницы, как это рекомендуется сделать в java в PDFBOX? Как удалить нижний колонтитул с каждой страницы в PDF?
Есть ли способ использовать PDRectangle, чтобы просто удалить...
5841 просмотров
schedule
13.07.2023
Абзац в PDFbox
У меня есть требование изменить файл PDF с помощью iText на PDFbox. У меня есть следующие сомнения:
Как создать абзац в поле PDF? (новый абзац в iText)
Как придать цвет шрифту в PDFbox? ( Font.BOLD , new Color(79, 129, 189)) в iText)...
1579 просмотров
schedule
19.02.2023
Java PDFBox, как получить объект File из PDDocument
Я пытаюсь получить экземпляр File или InputStream из PDDocument без сохранения PDDocument в файловой системе.
PDDocument doc= new PDDocument();
...
doc.save("D:\\document.pdf");
File f= new File("D:\\document.pdf");
Есть...
19872 просмотров
schedule
20.02.2024
Извлечение встроенных файлов из pdf с помощью pdfbox в приложении .NET
Я разрабатываю приложение .NET, используя pdfbox для извлечения метаданных, содержимого и прикрепленного файла из PDF. Мне удалось извлечь метаданные и содержимое, но застрял при извлечении прикрепленных/встроенных файлов.
У меня есть PDF-файл со...
1145 просмотров
schedule
01.04.2022
Как использовать PDFBox с Eclipse? Упаковывает ли он в файлы jar?
Я пишу Java-программу в eclipse, которая будет читать в файле PDF, анализировать строки отчета в формате PDF и выдавать статистику о том, что было прочитано. Чтобы прочитать в файле PDF (путем извлечения текста), я использую PDFbox. Цель этого...
10006 просмотров
schedule
10.09.2022
PDFBox - гарантируется ли порядок чтения с помощью processTextPosition PDFTextStripper?
Я использую PdfTextStripper (PDFBox 1.8.2) для обработки каждого TextPosition в файле PDF. Я протестировал множество файлов и заметил, что он обрабатывает текст в порядке чтения. Однако это не работает, если в pdf есть нижние колонтитулы (docx,...
2054 просмотров
schedule
19.03.2023
Как проверить, защищен ли PDF от печати с помощью pdfbox
Я хочу проверить, защищен ли PDF-файл от печати с помощью PDFBox Java API. Есть ли какой-либо API для этого или любой другой способ добиться этого?
Ждем ваших любезных ответов.
Арин...
184 просмотров
schedule
25.11.2023
API или itext и PDFBox
Как использовать существующий PDF-файл и заполнить информацию, предоставленную пользователем онлайн или в программе Java. Я знаю, что itext и pdfbox используются, но все они показывают документацию для создания нового PDF-файла, а затем заполняют...
626 просмотров
schedule
06.07.2022
цифровая подпись с помощью pdfbox
Я пытаюсь добавить несколько подписей в свой PDF-файл с помощью pdfbox, я пытаюсь использовать две подписи, и вторая подпись всегда оказывается недействительной. Пожалуйста, посоветуйте, может ли PDF-файл быть подписан цифровым образом несколько раз?...
10836 просмотров
schedule
07.10.2022
Редактировать изображения в файле PDF с помощью объекта COSStream
Я пытаюсь редактировать изображения в файле PDF, используя библиотеку PDFBox. Как у меня пример работает только для изображений jpeg. ImageIO.read() не может декодировать изображения с суффиксом «png». Вот пример кода. Итак, мой вопрос: как...
1246 просмотров
schedule
08.07.2022
Перемещение OCR из PDF в другой — Java
Добрый день, у меня проблема в моем проекте, это сжатие PDF, процесс выглядит следующим образом: Извлечение изображений из PDF Зависание OCR Compression Stock OCR + Объединение изображения и преобразование PDF на страницу Объединение всех...
97 просмотров
schedule
30.06.2022
Удалить поле ID из PDF с помощью Apache PDFBox
Мне нужно сравнить с PDF-документами, которые были созданы с помощью iText. Мне действительно удалось сравнить документы, но я спотыкаюсь о крошечную разницу.
При открытии PDF-файлов в редакторе, таком как Notepad ++, я вижу, что в конце файла...
888 просмотров
schedule
14.09.2022
PdfBox - кодировка в извлеченном тексте
Некоторые PDF-файлы содержат текст со «странной» кодировкой. Например. там http://www.iwb.ch/media/Unternehmen/Documente/inserat_leiter_pm.pdf Если я скопирую текст, например, в Acrobat Reader и вставлю куда-нибудь, я не получу те символы, которые...
376 просмотров
schedule
14.01.2023
Выделите текст с помощью PDFbox
Привет, я новичок в Pdfbox , и я хочу выделить определенный характер файлов PDF. Прямо сейчас я могу получить координаты персонажа и хочу выделить его.
Я видел по этой ссылке: выделить текст использование pdfbox, когда известно его...
1591 просмотров
schedule
15.03.2023
Как нарисовать строку в определенной позиции на странице PDF в Java с помощью pdfbox?
У меня есть координата PDF (x, y) в качестве входных данных. Мне нужно нарисовать строку с заданной входной координатой [например: - (x, y) = (200 250)]. Я использую pdfbox. Когда я использую описанный ниже метод moveTextPositionByAmount, я не...
7499 просмотров
schedule
24.10.2022