Специальный символ HTML ( & # 39; -› quot ) в файле XML

Я получил " & # 39; " в моем файле XML. (это символьный код для цитаты в HTML)

EX :

‹ desc > blabla bla & # 39; бла бла ла. ‹ / убыль>

Когда я анализирую его с помощью String tmp = itemOfEvent.getFirstChild().getNodeValue(), он обрезает мой текст прямо перед цитатой.

У меня произошел сбой с URL.encode(tmp, "UTF-8")

Идея получше?


person zobi8225    schedule 10.05.2011    source источник
comment
это не просто особенное, это особенное!   -  person Timothy Groote    schedule 10.05.2011
comment
Кроме того, какой это язык? это Ява?   -  person Timothy Groote    schedule 10.05.2011


Ответы (3)


Вы говорите, что текст закодирован в HTML, поэтому попробуйте следующее:

String fixedTmp = Html.fromHtml(tmp).toString();
person TofferJ    schedule 10.05.2011
comment
пробую ничего не меняется. - person zobi8225; 10.05.2011

Лучшим решением, которое я нашел, было заменить плохой символ

xmlString = xmlString.replaceAll(" & #39;", " \ ' ");
person zobi8225    schedule 11.05.2011

Я предполагаю, что вы анализируете файл XML с помощью SAXParser? В этом случае обратите внимание, что метод 'characters()' может вызываться несколько раз при анализе одного элемента (как в вашем случае). Попробуй это:

private StringBuilder temp_val;
public void characters(char[] ch, int start, int length){
    temp_val.append(ch, start, length);
}
person Lukas Knuth    schedule 10.05.2011
comment
на самом деле, я сделал большую ошибку: я не получил возврата remplaceAll conction. я пробовал xmlString = xmlString.replaceAll(', \'); и эта работа - person zobi8225; 10.05.2011