кодирование немецких спецсимволов inferno

в StatET eclipse, а также в RStudio я установил

options(encoding = "ISO-8859-1")

в StatET у меня есть:

Sys.getlocale()
[1] "LC_COLLATE=German_Germany.1252;LC_CTYPE=German_Germany.1252;LC_MONETARY=German_Germany.1252;LC_NUMERIC=C;LC_TIME=German_Germany.1252"

в RStudio то же самое:

Sys.getlocale()
[1] "LC_COLLATE=German_Germany.1252;LC_CTYPE=German_Germany.1252;LC_MONETARY=German_Germany.1252;LC_NUMERIC=C;LC_TIME=German_Germany.1252"

все на одном компьютере, запущенном в одно и то же время, но с одним и тем же вводом (в обоих случаях вводился в консоль напрямую), я получаю разные результаты.

Студио:

strsplit("GRÜN", "")
[[1]]
[1] "G" "R" "Ü" "N"

Статус:

strsplit("GRÜN", "")
[[1]]
[1] "G" "R" "Ã" " "N"

Вопрос: Что еще мне нужно сделать, кроме установки Sys.setlocale() и encoding, чтобы две системы давали одинаковый результат?


person adibender    schedule 30.07.2013    source источник


Ответы (1)


Я не эксперт в этом, но если вы работаете в Windows, я подозреваю, что это языковой стандарт системы. В этом случае перейдите в: панель управления -> регион и язык -> административный -> изменить языковой стандарт системы [для программ, не поддерживающих Unicode]

У меня на компьютере все настроено для работы с русским языком, и это вообще не проблема, но когда я попробовал ваш код, я получил это:

Sys.setlocale("LC_CTYPE","german")
strsplit("GRÜN", "")
[[1]]
[1] "G" "R" "Ь" "N"

Таким образом, Rstudio явно путает умляут и русский мягкий знак, что часто делает Windows.

person Rolf Fredheim    schedule 25.10.2013
comment
Спасибо за ваш ответ, хотя на самом деле это не ответ на мой вопрос. Поскольку параметры локали одинаковы как для RStudio, так и для StatET, разница в выводе должна быть связана с чем-то другим... - person adibender; 25.10.2013
comment
конечно =) Я бы все же попробовал - некоторые программы полагаются на Windows для отображения нелатинских символов, а другие - нет. - person Rolf Fredheim; 25.10.2013