Быстрый способ чтения csv с кодировкой UTF-16LE

Я имею дело с файлами .csv с кодировкой UTF-16LE, этот метод работает для чтения файлов, но read.csv очень медленный по сравнению с read_csv.

  read.csv2(path,dec=",",skip=1,header=T,fileEncoding="UTF-16LE",sep="/t")

К сожалению, я не могу заставить read_csv работать, я получаю только пустые строки и не могу даже указать кодировку в функции.

Я не могу поделиться своими данными, но если бы кто-нибудь имел дело с этой кодировкой, любая помощь была бы признательна.


person Sebastian    schedule 26.04.2016    source источник


Ответы (1)


Вы можете указать кодировки файлов с помощью функций чтения, таких как read_csv, с параметром локали: locale=locale(encoding="UTF-16LE"). Однако я не смог успешно прочитать файл utf-16le с read_csv. Я получаю сообщение об ошибке «Неполная многобайтовая последовательность». Есть связанная проблема, зарегистрированная, но у меня все еще есть проблемы с моим файлом - надеюсь, другие будет иметь больший успех.

person cmaimone    schedule 14.10.2017