Установите локаль по умолчанию для системы UTF-8

При запуске R внутри rApache локаль наследуется от веб-сервера Apache, поэтому Sys.getlocale() всегда равно "C". Я хотел бы, чтобы мое веб-приложение использовало UTF8, поэтому я использую:

Sys.setlocale("LC_ALL", 'en_US.UTF-8')

Однако это не работает на машинах, на которых эта локаль недоступна:

1: Setting LC_CTYPE failed, using "C" 
2: Setting LC_COLLATE failed, using "C" 
3: Setting LC_TIME failed, using "C" 
4: Setting LC_MESSAGES failed, using "C" 
5: Setting LC_MONETARY failed, using “C”

Есть ли способ использовать Sys.setlocale для установки языкового стандарта по умолчанию UTF-8? т.е. что-то, что также будет работать на Windows или на немецком Linux?


person Jeroen    schedule 13.12.2013    source источник
comment
Рассматривали ли вы установку кодировки «UTF-8» при любом чтении извне?   -  person IRTFM    schedule 14.12.2013
comment
я не уверен, что ты имеешь в виду   -  person Jeroen    schedule 14.12.2013
comment
Я неправильно запомнил то, что читал ранее на этой неделе на rdev. Возможно, что-то из этого поможет: stackoverflow.com /questions/9387910/ stackoverflow.com/questions/17985201/ stackoverflow.com/questions/5674519/   -  person IRTFM    schedule 14.12.2013


Ответы (3)


Попробуй это:

Sys.setlocale(category = "LC_ALL", locale = "English_United States.1252")
person Sathish    schedule 08.04.2014
comment
Да это верно. Я тестировал его только на Windows 7, 64 бит. Я не уверен насчет версий Linux, но помню, как однажды у меня возникла эта проблема в Ubuntu, и я следовал инструкциям по этой ссылке, чтобы изменить настройки локали. askubuntu.com/questions/162391 /how-do-i-fix-my-locale-issue. Пожалуйста, не цитируйте меня для версий Linux, потому что я не уверен. - person Sathish; 09.04.2014
comment
Я только что проверил это на своей машине с Ubuntu. Я прошел по ссылке в предыдущем комментарии. Затем я открыл новую сессию R. Настройки локали были автоматически изменены на en_US.UTF8. Если вы хотите вернуться к типу локали C или типу POSIX, используйте функцию: Sys.setlocale(category = LC_ALL, locale = C). ХТН - person Sathish; 09.04.2014
comment
На самом деле это не устанавливает локаль в UTF-8. Это параметр latin1. - person HansHarhoff; 25.08.2016
comment
В моем случае я решил проблемы с кодировкой, используя ту же строку, но установив "en_US.UTF-8" в качестве локали. Большое спасибо за это - person eblondel; 30.09.2016

Отвечая на мой собственный вопрос: в Ubuntu значение по умолчанию LANG определяется в /etc/default/locale:

jeroen@dev:~⟫ cat /etc/default/locale
# Created by cloud-init v. 0.7.7 on Wed, 29 Jun 2016 11:02:51 +0000
LANG="en_US.UTF-8"

Итак, в R мы могли бы сделать что-то вроде:

readRenviron("/etc/default/locale")
LANG <- Sys.getenv("LANG")
if(nchar(LANG))
   Sys.setlocale("LC_ALL", LANG)

Apache также имеет строку в /etc/apache2/envvars, которую можно раскомментировать, чтобы включить это.

person Jeroen    schedule 24.06.2017
comment
Спасибо, это действительно решило проблему с RApache при отправке текста в веб-сервис в UTF-8. - person ; 24.10.2018

Я думаю, вам нужно сделать проверку для ОС. Имена локалей различаются в зависимости от ОС, см. примеры в файле справки.

?Sys.getlocale()

Examples

Sys.getlocale()
Sys.getlocale("LC_TIME")
## Not run: 
Sys.setlocale("LC_TIME", "de")     # Solaris: details are OS-dependent
Sys.setlocale("LC_TIME", "de_DE.utf8")   # Modern Linux etc.
Sys.setlocale("LC_TIME", "de_DE.UTF-8")  # ditto
Sys.setlocale("LC_TIME", "de_DE")  # OS X, in UTF-8
Sys.setlocale("LC_TIME", "German") # Windows

## End(Not run)
Sys.getlocale("LC_PAPER")          # may or may not be set

## Not run: 
Sys.setlocale("LC_COLLATE", "C")   # turn off locale-specific sorting,
                                   # usually, but not on all platforms
## End(Not run)
person puslet88    schedule 03.11.2015