Преобразование docx в постскриптум

Мне нужно преобразовать документ Word (docx) в файл postscript, чтобы я мог использовать этот файл postscript для создания PDF с помощью инструмента командной строки Ghostscript.

Как создать файл postscript из docx?

Мне нужно кодировать с помощью .NET/C#. Я узнал о LaTeX, который генерирует постскриптум, но как мне заставить мой файл Word использоваться с LaTeX или любым другим инструментом для создания постскриптума?


person user581157    schedule 03.07.2013    source источник


Ответы (3)


Я упомяну три основных продукта, которые понимают DOCX.

Самый очевидный — MS Word. Он производит окончательную визуализацию всех файлов DOCX. Ничто никогда не будет точно таким же. По определению это всегда правильно. Однако на самом деле он не предназначен для автоматического преобразования, и заставить его делать такие вещи сопряжено с трудностями. На юридическом уровне EULA может противоречить выбранному вами решению.

OpenOffice.org — отличный продукт. Лицензионное соглашение гораздо удобнее. Свобода привлекательна. Однако, несмотря на то, что он обеспечивает довольно хороший результат для большинства документов DOCX, он подходит не для всех. Хотя это похоже на MS Word, это не то же самое, и это то, что вы можете заметить, особенно для более сложных документов. Вероятно, что более важно, опять же, он не предназначен для автоматических преобразований, и попытки заставить его делать это могут быть чреватыми и утомительными.

WordGlue .NET (над которым я работаю) — это родная библиотека .NET, которая понимает DOCX. Он разработан специально для создания выходных данных, аналогичных MS Word. Хотя я не собираюсь говорить, что он идеален (это большая задача), он превосходит OpenOffice.org в том смысле, что на самом деле пытается сделать это как конкретное дизайнерское решение. Однако, вероятно, самым большим преимуществом является то, что он предназначен для высокопроизводительного многопоточного преобразования на стороне сервера. Это родной .NET и, следовательно, мало влияет на безопасность.

Такие продукты, как ABCpdf (над которым я работаю), будут интегрироваться с этими тремя приложениями, чтобы обеспечить прямое преобразование в PDF. Зачем использовать PostScript, если вам нужен PDF? Однако, если вы действительно хотите сохранить как PostScript, вы тоже можете это сделать.

Или вы действительно можете написать свой собственный код для интеграции с этими продуктами. Просто имейте в виду приведенные выше предостережения относительно обременительного и утомительного использования MS Office и OpenOffice.org. Чтобы заставить эти вещи работать без присмотра, требуется очень много внимания.

person OnceUponATimeInTheWest    schedule 03.07.2013
comment
Спасибо. Но как эти компоненты, такие как Aspose.Words и другие коммерческие продукты, достигают функциональности преобразования документа Word в pdf без установки MS Word? Я ищу бесплатное решение, которое может конвертировать файлы doc в pdf без использования MS Word, которое не используется для взаимодействия. - person user581157; 04.07.2013
comment
Например, они могут лицензировать автономный механизм рендеринга от MS или WordGlue. Или что они сделали свой собственный, как WordGlue. Или что они этого не делают и на самом деле они используют слова за кулисами. Деньги, которые они зарабатывают на лицензировании, могут быть использованы для того, что не может сделать одна или небольшая организация, например, просто купить необходимую вам технологию ;) Однако, если вам не нужно, чтобы текстовый документ выглядел точно так же, тогда это довольно просто. PS: вы можете сделать приличное преобразование с помощью блокнота Word и драйвера принтера. - person joojaa; 05.07.2013
comment
Да, кстати, в Windows есть инструмент под названием Word Viewer, который также можно использовать для этой цели. В любом случае имеет смысл, что MS лицензирует только ком-конец, если он вам нужен. - person joojaa; 05.07.2013
comment
Вы можете написать свой собственный. Формат DOCX задокументирован. Самая возмутительно большая спецификация, которую я когда-либо видел. Но это есть. Формат DOC был реконструирован - в основном. Итак, дело доходит до написания механизма компоновки. Это тот же уровень сложности, что и написание веб-браузера. - person OnceUponATimeInTheWest; 12.07.2013

Вам необходимо распечатать его в файл PostScript из приложения, которое может читать файлы .docx. Или вы можете просто экспортировать прямо в PDf из приложения, насколько мне известно, все, что читает .docx и может печатать, также может записывать файл PDF.

person KenS    schedule 03.07.2013

Если у вас есть компьютер с Windows, вы можете использовать командную строку

"%ProgramFiles%\Windows NT\Accessories\wordpad.exe" /pt foobaar.docx "printerThatDumpsPS"

Вы можете бесплатно найти файловые принтеры для печати PostScript в Интернете. Или если у вас есть adobe pfdf, pdf exchange или любой принтер PS. Вы можете использовать С# для временной установки параметров принтера, чтобы он делал это за вас.

Так, например, используя обмен pdf следующим образом,

"%ProgramFiles%\Windows NT\Accessories\wordpad.exe" /pt foobaar.docx "PDF-XChange Printer 2012"

Создает pdf-файл без особого следа в любом месте, какая программа использовалась, при условии, что обмен pdf был настроен на сохранение файла без запроса.

Это создает сносный документ, но да, он теряет многие функции. Но этого может быть достаточно.

person joojaa    schedule 05.07.2013