Как разработчик, и я уверен, что я здесь далеко не один, мне всегда интересно понять, что «под капотом». Парсеры DOM для меня являются одними из лучших в этом списке. Мы все знаем известный пост . Я даже собрал немного "O RLY?" как из-за временной необходимости, так и из любопытства.
Однако моя потребность встретиться с человеком за кулисами остается неудовлетворенной. Как синтаксические анализаторы DOM или любые структурированные синтаксические анализаторы документов анализируют документы? Насколько я понимаю разработчика веб-приложений среднего уровня, это комбинация рекурсивного синтаксического анализа строк и логики сохранения состояния, мало чем отличающаяся от моей собственной хакерской попытки.
Волшебники никогда не должны раскрывать свои секреты, а если серьезно, то где он прячет кролика?