Проблема с java dom getTextContent()

когда я пытаюсь получить доступ к своим XML-данным из метода doGet моего сервлета, он выводит только значение до пробелов, включая все значение.

XML-файл:

<RealEstate>
    <Property>
            <Type>Apartment</Type>
            <Bedrooms>2</Bedrooms>
            <Bathrooms>2</Bathrooms>
            <Suburb>Bondi Junction</Suburb>
            <Rent>1000</Rent>
    </Property>
</RealEstate>

Затем я вызываю Suburb из сервлета Java в doGet:

Node suburb1 = doc.getElementsByTagName("Suburb").item(i);
out.println("<tr><td>Suburb</td>" + "<td>"+suburb1.getTextContent()+"</td></tr>");

и выводит только "Bondi" вместо "Bondi Junction"

Кто-нибудь знает, почему?


person tiger    schedule 03.04.2011    source источник


Ответы (2)


Я попробовал ваш код с вашим xml, и он распечатывает для меня весь текстовый контент, очень странно. В любом случае метод Node#getTextContext возвращает текстовое содержимое текущего узла и его потомков. Я предлагаю вам использовать node.getFirstChild().getNodeValue(), который выводит текстовое содержимое для вашего узла, а не его потомков. Другой способ — перебирать дочерние элементы узла Suburbs. Вы также должны посмотреть здесь.

Это мой main, который выводит один и тот же текст два раза, используя как getFirstChild().getNodeValue(), так и getChildNodes().item(i).getNodeValue():

public static void main(String[] args) throws SAXException, IOException, ParserConfigurationException  {

    DocumentBuilderFactory docBuilderFactory = DocumentBuilderFactory.newInstance();
    DocumentBuilder docBuilder = docBuilderFactory.newDocumentBuilder();
    Document doc = docBuilder.parse(new File("dom.xml"));

    NodeList nodeList = doc.getElementsByTagName("Suburb");
    for (int i = 0; i < nodeList.getLength(); i++) {
        Node node = nodeList.item(i);
        if (node.hasChildNodes()) {

            System.out.println("<tr><td>Suburb</td>" + "<td>"+node.getFirstChild().getNodeValue()+"</td></tr>");

            NodeList textNodeList = node.getChildNodes();
            StringBuilder textBuilder = new StringBuilder();
            for (int j = 0; j < textNodeList.getLength(); j++) {
                Node textNode = textNodeList.item(j);
                if (textNode.getNodeType() == Node.TEXT_NODE) {
                    textBuilder.append(textNode.getNodeValue());
                }
            }
            System.out.println("<tr><td>Suburb</td>" + "<td>" + textBuilder.toString() + "</td></tr>");
        }
    }
}

Это мой вывод с вашим xml:

<tr><td>Suburb</td><td>Bondi Junction</td></tr>
<tr><td>Suburb</td><td>Bondi Junction</td></tr>
person javanna    schedule 03.04.2011

Попробуйте перебрать дочерние элементы пригорода1 и значение конкатенации всех содержащихся текстовых узлов. Метод getTextContent() очень проблематичен в большинстве реализаций DOM. Он редко делает то, что, по мнению разработчиков, он должен делать.

person Konstantin Komissarchik    schedule 03.04.2011