regex remove punct удаляет не пунктуационные символы в R

При фильтрации и очистке текста на иврите я обнаружил, что

gsub("[[:punct:]]", "", txt)

фактически удаляет соответствующий символ. Символ «ק» расположен в месте «E» на клавиатуре. Интересно, что функция gsub в R удаляет символ «ק», после чего все слова путаются. Кто-нибудь знает, почему?


person Dmitry Leykin    schedule 02.05.2015    source источник


Ответы (1)