Поскольку ваше рабочее определение «группы согласных» состоит из двух или более согласных подряд, вы можете просто использовать следующий шаблон (без учета регистра, если вы хотите обрабатывать заглавные согласные):
[bcdfghjklmnpqrstvwxyz]{2,}
[bcdfghjklmnpqrstvwxyz]
— простой класс символов из белого списка для согласных (т. е. будет соответствовать только согласному)
{2,}
– два и более подряд
Вы можете протестировать шаблон на паре входных строк в соответствующей скрипте регулярного выражения.
Обратите внимание, поскольку гласные "a, e, я, о, у и иногда em> y", я включил y
в класс символов белого списка для согласных выше.
Вы можете бросить y
и использовать...
[bcdfghjklmnpqrstvwxz]{2,}
...если вы хотите безоговорочно рассматривать y как гласную, а не согласную; но правила, когда y является согласной немного сложнее, чем простое регулярное выражение (в основном требуется, чтобы вы сначала определили слоги, а затем местоположение y в них).
person
J0e3gan
schedule
10.01.2015
\b.\b
и замените пробелом, чтобы избавиться от всех изолированных букв, оставив вам последовательности не менее двух? Нравится RegEx101? - person Abecee   schedule 10.01.2015