Я хочу извлечь пару ссылок из html-страницы, загруженной из Интернета, я думаю, что использование linq to XML было бы хорошим решением для моего случая.
Моя проблема в том, что я не могу создать XmlDocument из HTML. , использование Load(string url) не сработало, поэтому я загрузил html в строку, используя:
public static string readHTML(string url)
{
HttpWebRequest req = (HttpWebRequest)WebRequest.Create(url);
HttpWebResponse res = (HttpWebResponse)req.GetResponse();
StreamReader sr = new StreamReader(res.GetResponseStream());
string html = sr.ReadToEnd();
sr.Close();
return html;
}
Когда я пытаюсь загрузить эту строку с помощью LoadXml (строка xml), я получаю исключение
'--' is an unexpected token. The expected token is '>'
Какой способ я должен использовать для чтения html-файла в анализируемый XML