Я пытался преобразовать строку UTF-8 в ее родственник в ISO-8859-1 для вывода ее в XML-документе, и независимо от того, что я пытаюсь, вывод всегда отображается неправильно.
Для упрощения вопроса я создал фрагмент кода со всеми тестами, которые я сделал, и после этого копирую/вставляю сгенерированный документ.
Вы также можете быть уверены, что я пробовал все возможные комбинации между новыми String(xxx.getBytes("UTF-8"), "ISO-8859-1")
, переключая UTF и ISO, а иногда также устанавливая одно и то же значение. Ничего не работает!
Вот фрагмент:
// @see http://stackoverflow.com/questions/229015/encoding-conversion-in-java
private static String changeEncoding(String input) throws Exception {
// Create the encoder and decoder for ISO-8859-1
Charset charset = Charset.forName("ISO-8859-1");
CharsetDecoder decoder = charset.newDecoder();
CharsetEncoder encoder = charset.newEncoder();
// Convert a string to ISO-LATIN-1 bytes in a ByteBuffer
// The new ByteBuffer is ready to be read.
ByteBuffer bbuf = encoder.encode(CharBuffer.wrap(input));
// Convert ISO-LATIN-1 bytes in a ByteBuffer to a character ByteBuffer and then to a string.
// The new ByteBuffer is ready to be read.
CharBuffer cbuf = decoder.decode(bbuf);
return cbuf.toString();
}
// @see http://stackoverflow.com/questions/655891/converting-utf-8-to-iso-8859-1-in-java-how-to-keep-it-as-single-byte
private static String byteEncoding(String input) throws Exception {
Charset utf8charset = Charset.forName("UTF-8");
Charset iso88591charset = Charset.forName("ISO-8859-1");
ByteBuffer inputBuffer = ByteBuffer.wrap(input.getBytes());
// decode UTF-8
CharBuffer data = utf8charset.decode(inputBuffer);
// encode ISO-8559-1
ByteBuffer outputBuffer = iso88591charset.encode(data);
byte[] outputData = outputBuffer.array();
return new String(outputData, "ISO-8859-1");
}
public static Result home() throws Exception {
DocumentBuilderFactory docFactory = DocumentBuilderFactory.newInstance();
DocumentBuilder docBuilder = docFactory.newDocumentBuilder();
//root elements
Document doc = docBuilder.newDocument();
doc.setXmlVersion("1.0");
doc.setXmlStandalone(true);
Element rootElement = doc.createElement("test");
doc.appendChild(rootElement);
rootElement.setAttribute("original", "héllo");
rootElement.setAttribute("stringToString", new String("héllo".getBytes("UTF-8"), "ISO-8859-1"));
rootElement.setAttribute("stringToBytes", changeEncoding("héllo"));
rootElement.setAttribute("stringToBytes2", byteEncoding("héllo"));
TransformerFactory tf = TransformerFactory.newInstance();
Transformer transformer = tf.newTransformer();
transformer.setOutputProperty(OutputKeys.ENCODING, "ISO-8859-1");
StringWriter writer = new StringWriter();
transformer.transform(new DOMSource(doc), new StreamResult(writer));
String output = writer.getBuffer().toString().replaceAll("\n|\r", "");
// The following is Play!Framework specifics for rendering an url, but I believe this is not the problem (I checked in the developer console, the document is correctly in "ISO-8859-1"
response().setHeader("Content-Type", "text/xml; charset=ISO-8859-1");
return ok(output).as("text/xml");
}
И результат:
<?xml version="1.0" encoding="ISO-8859-1"?>
<test original="héllo" stringToBytes="héllo" stringToBytes2="héllo" stringToString="héllo"/>
Как я могу продолжить?
response
. Если вы говорите оresponse()
из Play!Frameowork, тоsetCharacterEncoding()
нет (я использую Play! 2.1.5). Также нетsetCharacterEncoding()
в doc` (Документ) - person Cyril N.   schedule 23.02.2014setHeader
. В Play v2.1.5 нетencoding
(но есть CONTENT_ENCODING, который является окончательным) - person Cyril N.   schedule 23.02.2014