В настоящее время мне интересно, как обращаться с идентификаторами фрагментов, ссылка, из которой я хочу получить информацию, содержит идентификатор фрагмента. Кажется, что HtmlUnit отбрасывает «#/db4mj» моего URL-адреса и, следовательно, загружает исходный URL-адрес.
Кто-нибудь знает способ борьбы с фрагментами идентичности? (Я могу опубликовать пример кода для дальнейшего объяснения, если это необходимо)
ИЗМЕНИТЬ
Поскольку у меня не было много просмотров (и ответов), я собираюсь добавить награду. Извините, что только 50, но у меня было только 79 для начала
ИЗМЕНИТЬ
Вот пример кода по запросу.
Наш URL будет следующим: http://browse.deviantart.com/resources/applications/psbrushes/?order=9&offset=0
Поэтому, если вы посмотрите на содержимое ссылки, вы увидите несколько кистей, которые также содержат URL-адреса. Итак, мой скрипт захватывает URL-адрес: http://browse.deviantart.com/resources/applications/psbrushes/?order=9&offset=0#/dbwam4
Как видите, здесь есть идентификатор фрагмента #/dbwam4. Теперь я пытаюсь получить содержимое этой страницы, но HtmlUnit по-прежнему считает, что оно находится на исходном URL-адресе.
Вот пример кода в моем сценарии, где он не работает с URL-адресом идентификатора фрагмента, но не имеет проблем с исходным URL-адресом.
client = new WebClient(BrowserVersion.FIREFOX_3)
client.javaScriptEnabled = false
page = client.getPage(url) //url with fragment identifier
//this is on the url with the fragment identifier only, not the original url
img = page.getByXPath("*[@id="gmi-ResViewSizer_img"]")
Я ожидаю, что смогу получить определенную информацию из URL-адреса с идентификатором фрагмента, но не могу получить к нему доступ вообще.