pandoc: не удается декодировать байт '\ xd0': Data.Text.Encoding.Fusion.streamUtf8: неверный поток UTF-8

Я получаю эту ошибку, когда делаю pandoc --filter pandoc-citeproc myfile.markdown myfile.pdf

pandoc: не удается декодировать байт '\ xd0': Data.Text.Encoding.Fusion.streamUtf8: неверный поток UTF-8

Я выполнил поиск здесь и здесь, но Я дважды проверил в текстовом редакторе, и мой файл закодирован в UTF-8. В нем есть испанские символы с акцентом, но в прошлом эта же команда работала без проблем. Любые указатели на решение будут оценены.


person Offray    schedule 04.02.2014    source источник
comment
Я решаю проблему, добавляя | iconv -t utf-8 | в конвейер   -  person Pablo Bianchi    schedule 16.07.2021


Ответы (2)


Виноват. Проблема связана с командой, которую я использую, чтобы указать pandoc создать вывод в формате pdf. Правильная команда должна быть:

pandoc --filter pandoc-citeproc myfile.markdown -o myfile.pdf

обратите внимание на флаг -o между входным файлом уценки и выходным файлом PDF. Вот почему я получил то же сообщение utf-8, которое люди, пытающиеся конвертировать из pdf в другие форматы, задокументированы в моих ссылках.

person Offray    schedule 04.02.2014

Проверить кодировку JabRef

В моем случае я столкнулся с похожей ошибкой при преобразовании Pandoc Markdown в XHTML. Виновником был набор цитирований BibTeX, которые JabRef по умолчанию закодирован в ISO8859_1.

Это поведение JabRef по умолчанию можно изменить раз и навсегда, установив Default encoding: в UTF8 в меню Options > Preferences > General JabRef.

person Serge Stroobandt    schedule 21.08.2016