У меня огромный HTML, но на определенном уровне есть 10 штук article
элемента. Мне нужна тема.
<article class="box-product-big box-product-full clearfix" >
<div class="list-left">
<div class="cover">
<a id="book_cover_3100529" href="/film/fritz_lang.m-egy-varos-keresi-a-gyilkost-dvd.html">
<img src="http://s06.static.libri.hu/cover/d4/3/1090228_3.jpg" alt="Fritz Lang - M- Egy város keresi a gyilkost - DVD"/>
</a>
</div>
<div class="desc">
<a class="book-title" href="/film/fritz_lang.m-egy-varos-keresi-a-gyilkost-dvd.html">
..
</article>
Вот соответствующий DOM:
С помощью следующего шаблона я пытаюсь получить их, но возвращается нулевая часть:
var error: NSError?
let pattern = "<article class=\"box-product-big box-product-full clearfix\">[\\S\\s]*?</article>"
var regex = NSRegularExpression(pattern: pattern, options: NSRegularExpressionOptions.CaseInsensitive, error: &error)!
if error != nil {
println(error)
}
let a = regex.matchesInString(str, options: NSMatchingOptions.ReportCompletion, range: NSMakeRange(0, count(str)))
Есть идеи, что не так?
Данные взяты отсюда: http://www.libri.hu/talalati_lista/?text=m
Пробовал с разным экранированием, но получаю ошибку:
Строковые литералы могут включать следующие специальные символы: Экранированные специальные символы \0 (нулевой символ), \ (обратная косая черта), \t (горизонтальная табуляция), \n (перевод строки), \r (возврат каретки), \" (двойной кавычка) и \' (одинарная кавычка)
"<article\\s+class\\s*=\\s*\"box-product-big[ ]+box-product-full[ ]+clearfix\"\\s*>[\\S\\s]*?</article\\s*>"
- person   schedule 15.06.2015