проблема с запросом xpath в быстром майнере

У меня проблемы с использованием xpath в Rapidminer. Ниже приведен пример html, из которого я пытаюсь извлечь данные. У меня проблемы с получением номера 7001 и Калфорнии.

Я использую //h:span[@class='detail-block']//h:/text() и могу получить «Число:». Затем я пробую //h:span[@class='detail-block']/span//h:/text() и ничего не получаю. Я пробовал кучу вариаций этого и до сих пор ничего не придумал. Я могу заставить все работать в электронной таблице Google =importXML, но не в Rapidminer.

<div class="information">
<h2 class="underline">Information</h2>
<span class="detail-block"><span class="detail-attribute">Number:&nbsp;</span>         
<span>7001</span></span>
<span class="detail-block"><span class="detail-attribute">Location:&nbsp;</span> <span>California</span></span>

person user2503901    schedule 20.06.2013    source источник


Ответы (1)


Я не понимаю, почему ваш «рабочий» пример (//h:span[@class='detail-block']//h:/text()) должен подойти. h: — это префикс пространства имен. после руки должен следовать узел или атрибут.

//h:span[@class='detail-block']//text() вернет любые зависимые текстовые узлы в span[@class='detail-block']: Number: 7001 Location: California

Для «Номера:» используйте:
//h:span[@class='detail-block'][1]/h:span[1]/text()

Для "7001 //h:span[@class='detail-block'][1]/h:span[2]//text()

И для "Калифорнии"

//h:span[@class='detail-block'][2]/h:span[2]//text()

person hr_117    schedule 20.06.2013
comment
@ user2503901: Если это то, что вы ищете, отметьте ответ как действительный. (Возможно посмотреть в faq). - person hr_117; 22.06.2013