Вопросы по теме 'python-unicode'

Как работать со смесью символов UTF-8 и ISO-8859-1 в Python?
У меня есть набор документов, которые содержат символы, закодированные как в UTF-8, так и в ISO-8859-1. Я бы хотел, чтобы они были только в кодировке UTF-8. Когда я беру документ и декодирую его в UTF-8 с помощью doc.decode('utf-8') , я получаю...
1313 просмотров

Django: DatabaseError: рядом с nyny����1: синтаксическая ошибка
Код: >>> from django.core import serializers >>> objects = serializers.deserialize('xml', fixturestr.encode('utf8')) >>> o = next(objects) >>> o <DeserializedObject: countries.Country(pk=AF)> >>>...
897 просмотров
schedule 24.04.2024

Ошибки Python Unicode, синхронизируйте среду разработки и производство
Я только что столкнулся с несколькими ошибками юникода в приложении, которое я запускаю, которое время от времени приходится иметь дело с действительно странными строками, совсем недавно, Pınar Karsıyaka в моей среде разработки (Aptana с...
368 просмотров

Латинские символы Python и Unicode
У меня есть древовидная структура, в которой ключевые слова могут содержать латинские символы. У меня есть функция, которая перебирает все листья дерева и добавляет каждое ключевое слово в список при определенных условиях. Вот код, который у меня...
7594 просмотров

Загрузка zip-файла непосредственно в AWS S3 с использованием Python urllib2
Я пытаюсь загрузить zip-файл непосредственно на S3 с помощью скрипта Python, но сталкиваюсь с некоторыми ошибками декодирования Unicode. Что я делаю, так это генерирую предварительно подписанную ссылку S3, а затем загружаю в нее данные. Я знаю,...
2510 просмотров
schedule 27.10.2022

UnicodeEncodeError в python 3 в редакторе eclipse
У меня странная проблема с чтением файла с сохраненным форматом utf-8 (он сохранен на персидском языке). Я использую из eclipse luna и пишу следующий код для чтения из моего файла и отображения его во внутренней консоли eclipse. когда я использую...
21 просмотров

Декодирование Python с ошибками = заменить
Используя Python 2.7, я беру некоторый HTML-код с веб-сайта в виде строк и сразу же декодирую его в Unicode. Поскольку позже мне нужно будет знать, где произошли какие-либо ошибки декодирования, я подумал, что лучше всего использовать...
2038 просмотров

UnicodeDecodeError: (кодек utf-8) при чтении CSV-файла
то, что я пытаюсь, это прочитать csv, чтобы создать кадр данных --- внести изменения в столбец --- снова обновить/отражать измененное значение в тот же csv (to_csv) - снова попытаться прочитать этот csv, чтобы создать другой кадр данных... там я...
103881 просмотров
schedule 01.10.2022

UnicodeEncodeError: кодек ascii не может кодировать символ u'’' в позиции 6: порядковый номер не в диапазоне (128)
Я пытаюсь получить список из 500 ресторанов Амстердама с TripAdvisor; однако после 308-го ресторана я получаю следующую ошибку: Traceback (most recent call last): File "C:/Users/dtrinh/PycharmProjects/TripAdvisorData/LinkPull-HK.py", line 43,...
31159 просмотров

UnicodeEncodeError: кодек «ascii» не может кодировать символ «\ xb0» в позиции 23: порядковый номер не в диапазоне (128)
Я пытаюсь загрузить изображение по ссылке, содержащей специальный символ, например: imageUrl = 'https://www.residentadvisor.net/images/labels/3000°records.jpg' request_=urllib.request.Request(imageUrl,None,headers) #The assembled request...
1044 просмотров
schedule 07.07.2022

Python-3 и \x Vs \u Vs \U в строковой кодировке и почему
Почему в Python 3 используются разные представления строк, ориентированные на байты? Не будет ли достаточно иметь одно представление вместо нескольких? Для печати номера диапазона ASCII строка показывает последовательность, начинающуюся с \x :...
8267 просмотров

Почему бы не использовать патч sys.getfilesystemencoding() для обезьян?
В Python можно прочитать кодировку файловой системы с помощью sys.getfilesystemencoding() . Но, похоже, нет официального способа установить кодировку файловой системы. См.: Как изменить кодировку файловой системы с помощью python? Я...
206 просмотров
schedule 28.09.2023

Правильная длина строки неанглийских символов в Python3
Мне дается строка символов иврита (и некоторых других арабских символов. Я не знаю ни одного из них) в файле צוֹר‎ Когда я загружаю эту строку из файла в Python3 fin = open("filename") x = next(fin).strip() Длина x кажется равной 5...
1449 просмотров
schedule 08.01.2023

Преобразовать строку в utf-16
У меня есть текстовый файл с японскими иероглифами. Я прочитал из него строку и хочу специально преобразовать ее в utf-16. Как я могу сделать это с помощью Python? Мой код выглядит так - with open("C:\\Users\\badri\\jap.txt", 'rb') as f:...
4598 просмотров
schedule 13.02.2023

Ошибка UnicodeDecodeError при загрузке word2vec
Полное описание Я начинаю работать с встраиванием слов и нашел о нем очень много информации. На данный момент я понимаю, что могу тренировать собственные векторы слов или использовать ранее обученные, такие как Google или Wikipedia, которые...
2585 просмотров

Ошибка unicode шифрования Python при преобразовании из Python 2 в Python 3
Я нашел код, который хочу включить в свою программу шифрования Python. Он должен шифровать файлы в том же каталоге кода, и я хочу, чтобы он был нацелен на каталог. Но он написан на Python 2, и когда я меняю код, чтобы он соответствовал Python 3, я...
1632 просмотров

Как получить правильное значение строки в кодировке UTF-8 (из Unicode) из файла из Python3, который был закодирован с использованием Python2?
Я перемещаю свое приложение с Python2 на Python 3. Приложение сохраняет конфигурацию в файл, и перед сохранением один из атрибутов кодируется в utf-8. Например: username='ᚠᛇᚻ᛫ᛒᛦᚦ᛫ᚠᚱᚩᚠᚢᚱ' сохраняется как '\xe1\x9a\xa0\xe1\x9b....x9a\xb1'...
29 просмотров

Python: как анализировать символы, отличные от ASCII, в строке
В своем сценарии Python я пытаюсь прочитать текстовый файл, содержащий столбцы с именами и фамилиями людей, некоторые из которых содержат символы, отличные от ASCII, например ñ . Но когда я это делаю, я получаю ошибку UnicodeDecodeError: 'utf8'...
224 просмотров

Проблемы с отображением символов Unicode в Python (объединение символов, символов кана и т. Д.)
Я пытаюсь составить несколько программ для анализа текста на нескольких языках, включая латынь, древнегреческий и китайский. Среди них один из них предназначен для анализа слова на латыни и разложения его на составляющие его слоги, затем нахождения...
406 просмотров

Сценарий Python не может правильно кодировать специальные символы Unicode
Я конвертирую текстовый файл ( words.txt ), который в основном является словарем в этом формате: good morning, Góðan daginn в файл json ( converted.json ) в этом формате { "wordId": 1, "word": "good morning", "translation":...
106 просмотров