Regex соответствует многобайтовым числам

Мне нужно сопоставить многобайтовые символы ０１２３４５６７８９ из японского языка, используя регулярное выражение.

[0-9] в этом случае не работает. Как я могу сделать это регулярное выражение? Это мой первый опыт сопоставления многобайтовых строк.

ОБНОВИТЬ

Сопоставление строки из 4 цифр, например года рождения, было успешным как с кодировкой UTF-8, так и без UTF-8, используя следующие regex

^([0-9]{4}||[\uFF10-\uFF19]{4})$

javascript regex multibyte

Community 08.08.2013 источник

comment

０１２３４５６７８９это юникод? - Robert Harvey 08.08.2013

comment

Если это Юникод, см. эту ссылку - gr3co 08.08.2013

Ответы (2)

arrow_upward
4
arrow_downward

Регулярное выражение, эквивалентное /[0-9]/ для этих многобайтовых чисел в Javascript,

/[\uff10-\uff19]/

Tim Pietzcker 08.08.2013

arrow_upward
3
arrow_downward

var str = '０１２３４５６７８９';
console.log(
    str.match(new RegExp('[０-９]', 'g')),
    str.match(/[\uff10-\uff19]/g) 
);
//returns ["０", "１", "２", "３", "４", "５", "６", "７", "８", "９"] both ways

Обязательно сохраните файл .js в правильной кодировке (UTF-8), если используете неэкранированную версию.

Fabrício Matté 08.08.2013

Regex соответствует многобайтовым числам

ОБНОВИТЬ

Ответы (2)

Похожие вопросы