PHP простой парсер HTML Dom, как разбирать Javascript?

Ну вот мы идем,

Есть ли способ разобрать Javascript с помощью PHP простого парсера HTML Dom? Я хочу анализировать веб-контент, созданный Javascript, без прямого способа анализа изображений и т. д., потому что они создаются после того, как Javascript генерирует его.

Вот исходный веб-код: view-source:http://www.pcbox.com/discos-duros_serial-ata-2---sata2_040507.aspx?ch=00000205110002000212031201fa80376ded0f8f1a2a036267416fe20#productos

и в Интернете: http://www.pcbox.com/discos-duros_serial-ata-2---sata2_040507.aspx?ch=00000205110002000212031201fa80376ded0f8f1a2a036267416fe20#productos

Если вы проверите источник, изображения... и т. д. генерируются JavaScript, поэтому я не могу их напрямую анализировать. Есть ли парсер для PHP, который может это сделать?


person Nonyck    schedule 18.07.2011    source источник


Ответы (1)


Нет. Вы можете анализировать DOM только в том виде, в каком он существует. Для этого вам понадобится целый движок javascript, интегрированный в парсер. Я полагаю, что потенциально это можно было бы сделать с помощью других внешних инструментов (например, передать node.js или что-то в этом роде, а затем получить окончательный DOM обратно для синтаксического анализа с помощью php), но это очень сложно.

Можно также попытаться создать анализатор js для определенного набора вариантов использования, но это обязательно будет подвержено ошибкам, особенно если рассматриваемый html поступает с сайта, который вы не контролируете.

person prodigitalson    schedule 18.07.2011