XPATH извлекает текст в ‹br›

Я практикуюсь с XPATH для извлечения текста в HTML.

У меня такая структура:

<tbody>
  <tr class="table-row">
    <td class="table-cell">
        Name
        <br />
        Address
        <br />
        Postcode
        <br />
        Phone: 111111
        <br />
        Fax:  123456
        <br />
        Email:  <a class="mail" href="mailto:[email protected]">[email protected]</a>
        <br />
    </td>
  </tr>
  <tr class="table-row">
    <td class="table-cell">
        Name
        <br />
        Address
        <br />
        Postcode
        <br />
        Phone: 111111
        <br />
        Fax:  123456
        <br />
        Email:  <a class="mail" href="mailto:[email protected]">[email protected]</a>
        <br />
    </td>
  </tr>
  (...)
</tbody>

Мне удается перемещаться по разным узлам, но я не могу понять, как извлечь из текстового узла.

В частности, мне нужно извлечь текст внутри «Телефон:» и после <br /> и «Электронная почта:» и после <br /> во всех строках таблицы.

xpath

Marc 14.03.2017 источник

comment

Покажите, пожалуйста, XPath, который вы пробовали ... Вам тоже нужны <br />s или только тексты? - har07 15.03.2017

Ответы (1)

arrow_upward
0
arrow_downward

как насчет //td/text()[4] для телефона и //td/a для значения электронной почты

becixb 15.03.2017

XPATH извлекает текст в ‹br›

Ответы (1)

Похожие вопросы