XPATH извлекает текст в ‹br›

Я практикуюсь с XPATH для извлечения текста в HTML.

У меня такая структура:

<tbody>
  <tr class="table-row">
    <td class="table-cell">
        Name
        <br />
        Address
        <br />
        Postcode
        <br />
        Phone: 111111
        <br />
        Fax:  123456
        <br />
        Email:  <a class="mail" href="mailto:[email protected]">[email protected]</a>
        <br />
    </td>
  </tr>
  <tr class="table-row">
    <td class="table-cell">
        Name
        <br />
        Address
        <br />
        Postcode
        <br />
        Phone: 111111
        <br />
        Fax:  123456
        <br />
        Email:  <a class="mail" href="mailto:[email protected]">[email protected]</a>
        <br />
    </td>
  </tr>
  (...)
</tbody>

Мне удается перемещаться по разным узлам, но я не могу понять, как извлечь из текстового узла.

В частности, мне нужно извлечь текст внутри «Телефон:» и после <br /> и «Электронная почта:» и после <br /> во всех строках таблицы.


person Marc    schedule 14.03.2017    source источник
comment
Покажите, пожалуйста, XPath, который вы пробовали ... Вам тоже нужны <br />s или только тексты?   -  person har07    schedule 15.03.2017


Ответы (1)


как насчет //td/text()[4] для телефона и //td/a для значения электронной почты

person becixb    schedule 15.03.2017