Я могу прочитать файл csv, в котором есть столбец, содержащий китайские иероглифы (другие столбцы - английские и цифры). Однако китайские иероглифы отображаются неправильно. см фото ниже
Я загрузил файл csv с помощью pd.read_csv()
.
Либо display(data06_16)
, либо data06_16.head()
не будут правильно отображать китайские символы.
Я попытался добавить следующие строки в свой .bash_profile
:
export LC_ALL=zh_CN.UTF-8
export LANG=zh_CN.UTF-8
export LC_ALL=en_US.UTF-8
export LANG=en_US.UTF-8
но это не помогает.
Также я попытался добавить encoding
arg к pd.read_csv()
:
pd.read_csv('data.csv', encoding='utf_8')
pd.read_csv('data.csv', encoding='utf_16')
pd.read_csv('data.csv', encoding='utf_32')
Эти вообще не будут работать.
Как я могу правильно отображать китайские иероглифы?
Chinese
языков -- Скажитеencoding='gb2312'
? - person Nickil Maveli   schedule 03.09.2016UnicodeDecodeError: 'gb2312' codec can't decode bytes in position 2-3: illegal multibyte sequence
- person Daniel   schedule 04.09.2016