Шаблон REGEX для работы с кавычками или без них

У меня есть следующий BBCode, который мне нужно было разобрать

[url=http://www.google.com]Google[/url]
[url="http://www.google.com"]Google[/url]

Я пытаюсь извлечь как http://www.google.com, так и Google.

Теперь разница между двумя частями BBCode выше заключается в кавычках вокруг URL-адреса во втором BBCode.

Возможно ли, чтобы один код регулярного выражения извлекал мои точки данных и учитывал наличие или отсутствие кавычек?

Спасибо!

EDIT: просто для дальнейшего уточнения. В настоящее время я использую следующий шаблон Regex:

/\[URL=\"?([\s\S]*?)\"?\]([\s\S]*?)\[\/URL\]/gi

Это будет успешно соответствовать URL-адресу, если он заключен в кавычки или нет. Однако я хотел бы, чтобы окончательный результат был лишен всех кавычек. Возможно ли это с помощью самого фактического шаблона регулярного выражения, чтобы просто не включать кавычки в совпадение (если кавычки вообще есть)

javascript regex bbcode

Mark 09.03.2012 источник

comment

Да. Хм, что вы хотите, чтобы регулярное выражение делало? Создать элемент a? Что-то другое? И что вы пробовали?. - David says reinstate Monica 10.03.2012

comment

То, что вы хотите, возможно, но более эффективно просто удалить все кавычки заранее s/"//g; - vol7ron 10.03.2012

Ответы (2)

arrow_upward
2
arrow_downward

Да:

/\[url=("?)(http://www\.google\.com)\1\](Google)\[\/url\]/

захватит '"' или ''; 'http://www.google.com'; и 'Google'.

(Я понимаю, что на самом деле вам не нужно захватывать '"' или '', но именно так регулярному выражению удается потребовать, чтобы двойные кавычки либо присутствовали, либо отсутствовали. Я также понимаю, что вам, вероятно, нужно охватить другую ссылку- цели и тексты ссылок, помимо вашего примера, но я предполагаю, что вы уже знаете, как с этим справиться, и просто спрашиваете о проблеме с необязательными двойными кавычками?)

ruakh 09.03.2012

comment

Вы правы, я могу обработать фактическую часть URL-адреса, мне просто нужно, чтобы регулярное выражение соответствовало шаблону, если URL-адрес имеет кавычки или нет, но если он имеет кавычки, он должен отбросить кавычки. Но ваш шаблон будет соответствовать кавычкам или не будет кавычек, но если есть кавычки, он фактически не отбрасывает кавычки. - Mark; 10.03.2012

comment

@Марк: я не знаю, что ты имеешь в виду. Вторая группа захвата не будет включать кавычки. Регулярное выражение не может на самом деле отбрасывать вещи. - ruakh; 10.03.2012

comment

Я предполагаю, что слово «отбросить» неверно, я имею в виду «не включать кавычки в финальное совпадение, *** если они там есть». - Mark; 10.03.2012

comment

@Mark: Ну, тогда это регулярное выражение действительно отбрасывает кавычки: вторая группа захвата - это просто 'http://www.google.com', а не '"http://www.google.com"'. - ruakh; 10.03.2012

comment

поэтому я сейчас использую этот окончательный шаблон /[URL=(?)([\s\S]*?)\1]([\s\S]*?)[\/URL]/gi, и он по-прежнему включает в себя вторая группа захвата. Может быть, это проблема с javascript ...? - Mark; 10.03.2012

comment

@Mark: это регулярное выражение выглядит сломанным, поскольку у вас есть несколько экземпляров [ и ], которые должны быть \[ и \]. Кроме того, ваш подшаблон для URL-адреса настолько общий, что позволяет включать двойные кавычки; например, ваше регулярное выражение считает, что "asefasef"asefasef"asfasef" является допустимым URL-адресом. - ruakh; 10.03.2012

arrow_upward
2
arrow_downward

Чтобы сделать его более общим, вы должны сделать что-то вроде этого:

/\[url=\"?(https?://[^"\]]+)"?\]([^\[]+)\[\/url\]/

который даст вам URL-адрес в \1 и метку в \2

Bjørne Malmanger 10.03.2012

Шаблон REGEX для работы с кавычками или без них

Ответы (2)

Похожие вопросы