При фильтрации и очистке текста на иврите я обнаружил, что
gsub("[[:punct:]]", "", txt)
фактически удаляет соответствующий символ. Символ «ק» расположен в месте «E» на клавиатуре. Интересно, что функция gsub
в R удаляет символ «ק», после чего все слова путаются. Кто-нибудь знает, почему?