Алгоритм построения Томпсона и RE в NFA

Я пытаюсь создать метод, который будет принимать строку (действительное регулярное выражение) и выводить соответствующий недетерминированный конечный автомат. Из проведенного мной исследования следует, что алгоритм Томпсона наиболее применим здесь, поскольку Я буду обрабатывать только символы звезды Клини, союза и круглых скобок, а язык будет только {a, b, e}, где e представляет собой пустой переход.

Кроме того, большая проблема, с которой я сталкиваюсь, заключается в том, чтобы выяснить, как обрабатывать вложенные скобки в регулярных выражениях. Вход здесь будет оценен по достоинству.

Мой вопрос о лучшем/самом простом способе представить это в коде. Мне нужно будет отличать каждый узел друг от друга и отслеживать переходы, исходящие из узла, и куда эти переходы ведут. Я изучил использование орграфа, однако кажется, что вы можете представлять только узел и то, к чему может привести узел, исключая переход, который приведет вас к этому новому узлу. Любые предложения по архитектуре здесь будут оценены. Спасибо.

GregH 16.02.2015 источник

comment

В этом репозитории вы можете найти Java-реализацию конструкции Томпсона: github.com/meghdadFar/regex. - MAZDAK 30.11.2016

comment

Сначала из регулярного выражения создается NFA, затем входная строка сопоставляется с этим NFA. - MAZDAK 30.11.2016

Ответы (1)

arrow_upward
0
arrow_downward

Не знаю, поможет ли это, но я реализовал это на Python для моей монографии. К сожалению, текст на португальском языке, но реализация очень проста.

Фактически он компилирует выражение как последовательность недетерминированных инструкций для гипотетической машины. Например, выражение a(b|c)+d будет скомпилировано как:

 0000: CONSUME a
 0001: JUMP (1, 3)
 0002: CONSUME b
 0003: JUMP (2,)
 0004: CONSUME c
 0005: JUMP (1, -4)
 0006: CONSUME d
 0007: MATCH!

Есть только три типа инструкций (и MATCH появляется только в конце).

CONSUME x потребляет следующий символ ввода, если он x
JUMP (a, [b]) переходит ко всем меткам, определенным недетерминировано
MATCH! самоописание

Juan Lopes 16.02.2015

Алгоритм построения Томпсона и RE в NFA

Ответы (1)

Похожие вопросы