Я использую PHP Simple HTML DOM Parser для получения текста с веб-страницы. Страница, которой мне нужно манипулировать, выглядит примерно так:
<html>
<head>
<title>title</title>
<body>
<div id="content">
<h1>HELLO</h1>
Hello, world!
</div>
</body>
</html>
Мне нужно получить элемент h1
и текст без тегов. чтобы получить h1
, я использую этот код:
$html = file_get_html("remote_page.html");
foreach($html->find('#content') as $text){
echo "H1: ".$text->find('h1', 0)->plaintext;
}
А другой текст? Я также пробовал это в foreach, но я получаю полный текст:
$text->plaintext;
но он также вернул тег H1
...
plaintext
вернет что-то еще? - person hakre   schedule 24.03.2012DOMDocument
. Тогда было бы->nodeValue
. - person hakre   schedule 24.03.2012